有个小插曲,是这个软件的名字我竟然搞错了…
宏基因组分析,首先需要的结果是获得物种分类信息,前面我们提到,宏基因组有两种分析方式分别是基于序列比对和组装的,组装对电脑硬件的要求是超级高的,不过比对,就轻松多了,得益于算法的优化,有的软件可以实现在个人电脑上进行分析。最近的“AMD YES”也很给力,把普通个人电脑推向了8核16G RAM这种配置,终于追上了手机(虽然二者性能不可同日而语)。算力有了,充分利用起来呀,来个宏基因组玩玩呀!
这里我的需求是使用miniconda安装的Python,然后系统安装的R语言,然后我想让两个结合在一起使用,发现没有现成的教程,于是自己摸索了下,大概就是内核配置的问题。
生物信息数据分析工具 QIIME(Qua…
宏基因组研究的目的是通过对菌种(株)的鉴定,获得真实的多样性数据,功能,协作和进化。宏基因组分析的三个任务是物种分析(它们是谁),功能分析(能干什么,潜力),比较分析(怎么比较它们)。
最近手上有了一台新的红米笔记本16英寸,r7-4700u-16G的电脑,比起之前的thinkpad E431性能有了不小的提升,八核心八线程,多线程处理速度相比之前的双核4线程要强了不止两倍,虽然同样16DG的内存,频率也从1600MHz DDR3变为2600MHz了,别的不提,只16S降噪生成特征表的步步骤,速度就提升明显,八核心左右的运算任务,暂时就不需要再开云服务进行了。
还是获得16S物种丰度得老问题,最近在一台新机器上安装qiime1,发现有报错,对于这种停止维护的软件,也是正常现象吧,于是想别的办法解决,恰巧最近读R几本R语言的入门书,发现prop.table()这个函数是可以实现相关功能的,于是学习使用下。可能你早已会做这个啦,还是分享一下,看看有没有人需要。
直以来,看到这本书《Statistical Analysis of Microbiome Data with R》活跃在朋友圈和公众号,既然口碑这么好,当然有必要学习下啦!分享记录一下书中我所认为重要的点。
更新亮点都有啥呢?大概是几个命令和以前不一样了。
我们知道,不管是16S等扩增子测序,还是宏基因组,最后最重要的结果,就是物种的丰度情况了,qiime2给出的16S丰度结果是一个计数,对于许多软件来说这是可用的,那么如果我们想获得一个直接的百分比数据应该怎样做呢?