更新亮点都有啥呢?大概是几个命令和以前不一样了。
我们知道,不管是16S等扩增子测序,还是宏基因组,最后最重要的结果,就是物种的丰度情况了,qiime2给出的16S丰度结果是一个计数,对于许多软件来说这是可用的,那么如果我们想获得一个直接的百分比数据应该怎样做呢?
除了引用最多的qiime流程,u/vsearch(usearch是一人一已之力单挑学术界)和mothur(用的人越来越少的感觉),最近又发现了一两个流程,一并分享给大家。
最近有朋友和我交流纳米孔16S测序数据的分析,发现真的没有从头完成过一次这方面的数据分析,然后发现这方面的资料也比较少,于是学习一下,和大家分享。坦白说,牛津纳米孔测序技术在16S多样性研究方面还是有些不足的,只能说勉强够用,主要应用场景是在一些现场快速检测方面,主要是病原菌这种。但是,相信随着测序准确度的提高和分析软件的改进,相信它的应用会越来越多。感谢互联网的便利和分享精神,今天的我们可以方便地获得测序的原始数据,并可以自由进行分析。
近年来,已经开发出第三代测序技术,并已与前一种测序策略并行和互补地应用。尤其是,牛津纳米孔技术公司(ONT)推出了纳米孔测序技术,该技术已在分子生态学家中广为流行。纳米孔技术提供了低廉的价格,便携性和快速的测序通量。这项强大的技术最近已通过16S rRNA分析测试,显示出令人鼓舞的结果。但是,与以前的技术相比,缺乏专门用于分析纳米孔16S序列的生物信息学工具和标准。由于其显著的特征,研究人员最近开始在16S rRNA测序研究中对MinION的适用性进行评估,并获得了显蓍的结果。在这里,我们对应用于微生物组研究的MinION技术的最新进展进行了综述。
QIIME 2 2020.2 更新踩着2月的尾巴来了!疫情仍在,学习的好时光呀,加油!这次更新有一些小的命令更改,已经把需要关注的重点更新突出显示。官方提醒下一次的更新发布是QIIME 2 2020.5,请持续关注更新。
前面做的许多处理基本上自己拼凑来的,下面再看下完整解决方案。researchgate网站上有人说qiime1版本有这个双向数据配对不拼接的选项?这个没找到。主要发现了有两个方案,一个是有篇文章提出了一个流程*Hybrid-denovo*,还有一篇peer review的文章,几个人评议还有一个人不同意,anyway,都看下。
接着前面的内容,这里再进行下数据库的处理,看看从参考数据库就按测序数据处理是不是能提高物种注释的精度。这里先预报一下,种的分类结果并不能有明显的提升,或许是因为序列长度的缺陷,即使再努力提高技巧,终究不能解决根本的问题,250bp的长度,对比1500bp左右的全长,显然还是太短了,难以实现精确的分类,所以,要想更精确,只有上16S全长,这只能寄望于Pacbio,Oxford Nanopore,和10x linked reads或者类似的技术,比如华大的sLtFR等技术提升读长了。再激进些,等测序成本足够低,上宏基因组,宏转录组了。
前面我们探索了处理不能拼接的V4 PE150数据,首先双向reads根据质量情况分别切成120bp,然后使用dada2 R包进行了直接+10N拼接,生成ASV表,再分别使用dada2包,decipher包和qiime2进行了物种注释,基本上完成了一个最简单的分析过程。这里填下自己之前挖的坑,比较一下这个含有348条序列的样本,qiime2,dada2和的分类器哪个效果更好。
前面我们探索了处理不能拼接的V4 PE150数据,首先双向reads根据质量情况分别切成120bp,然后使用dada2 R包进行了直接+10N拼接,生成ASV表,再分别使用dada2包和qiime2进行了物种注释,基本上完成了一个最简单的分析过程,这里,使用比较流行的phyloseq包进行下多样性分析。