还是获得16S物种丰度得老问题,最近在一台新机器上安装qiime1,发现有报错,对于这种停止维护的软件,也是正常现象吧,于是想别的办法解决,恰巧最近读R几本R语言的入门书,发现prop.table()这个函数是可以实现相关功能的,于是学习使用下。可能你早已会做这个啦,还是分享一下,看看有没有人需要。
这是我两三年前学习过的一本书,我觉得这本书挺好,把生物学的问题直接在python学习中解决了,推荐给大家,之前还整理了习题代码,分享一下。之前分享在了github上,收获了10颗星,惭愧,已经是我最多星的一个。还有一两个习题记得没有解答出来,如果你解答出来了,欢迎交流!代码有的肯定不是最优的,只是一种解答方法,可能有错误,也欢迎指正,谢谢!我坚信分享使我们快乐,加油!我是用python3完成的,当然二者区别也很小(目前我基本只认识到了print函数的区别),除非遇上那种多年不遇的bug。
继续前面的学习,前面已经把软件安装完成,数据库准备好,下面就是分析的过程了,基本上按照原文的命令进行的,由于教程中没有给出tara_f135_full_megahit.fasta这个文件,这里我们就把这几个样本的组装提到了前面,自己组装获得这个序列,然后再进行物种注释。
前面提到,已经有家公司通过宏转录组(Metatranscriptomics)测序检测肠道微生物,面向消费者提供检测服务。对宏转录组充满了好奇,有这样的比方说,**宏基因组可以告诉我们这个微生物群落可能有什么样的功能(潜能),宏转录组就是告诉我们群落正在做什么**,相比宏基因组的眉毛胡子一把抓,宏转录组是更针对当下的结果。由于测序的目标序列少了很多,结果不是变态大,对计算机的配置要求也相对降低。苦于想学宏基因组暂时没有服务器的我,就退而求其次试试宏转录组了,相信不会让我失望。之前学习过单转录组数据的分析,一般的笔记本(双核,8g ram)扛了下来。鉴于中文网络上能找到的宏转录组教程基本没有,只在Github上搜索到两个,选其中一个学习下。
到目前为止,我们已经完成了所有工作,并复制并粘贴了许多命令来完成所需的操作。这可行!但是也可能很耗时,并且更容易出错。接下来,我们将向你展示如何将所有这些命令放入Shell脚本中。
前面做的许多处理基本上自己拼凑来的,下面再看下完整解决方案。researchgate网站上有人说qiime1版本有这个双向数据配对不拼接的选项?这个没找到。主要发现了有两个方案,一个是有篇文章提出了一个流程*Hybrid-denovo*,还有一篇peer review的文章,几个人评议还有一个人不同意,anyway,都看下。
最近有需求需要把很多excel里的引物序…
最近发现生信技能树VIP论坛群里在讨论jupyter lab这么一个工具,内心想尝试一下,毕竟一个好工具或许就可以改变你的学习态度和进程,工欲善其事,必先利其器嘛。我使用了这个工具之后,感觉又重新燃起了对R语言的学习热情呢。当然,手上的技能树讲义讲得好也至关重要。下面就说说我安装使用这个工具遇到的一点问题和解决的过程。
尝试再现Nano-Ampli文章的数据分析过程,由于原始数据不完整,可能有参数没列出等原因,没有成功再现出结果,理了理流程,欢迎大家指正,交流。
最近工作用到了一些回归分析方面的知识,整理一下,放在这里备忘。主要是简单的多元线性回归和分位数回归两种,基本上都只需要几个R语言命令就能解决了。