这里我的需求是使用miniconda安装的Python,然后系统安装的R语言,然后我想让两个结合在一起使用,发现没有现成的教程,于是自己摸索了下,大概就是内核配置的问题。
生物信息数据分析工具 QIIME(Qua…
宏基因组研究的目的是通过对菌种(株)的鉴定,获得真实的多样性数据,功能,协作和进化。宏基因组分析的三个任务是物种分析(它们是谁),功能分析(能干什么,潜力),比较分析(怎么比较它们)。
最近手上有了一台新的红米笔记本16英寸,r7-4700u-16G的电脑,比起之前的thinkpad E431性能有了不小的提升,八核心八线程,多线程处理速度相比之前的双核4线程要强了不止两倍,虽然同样16DG的内存,频率也从1600MHz DDR3变为2600MHz了,别的不提,只16S降噪生成特征表的步步骤,速度就提升明显,八核心左右的运算任务,暂时就不需要再开云服务进行了。
还是获得16S物种丰度得老问题,最近在一台新机器上安装qiime1,发现有报错,对于这种停止维护的软件,也是正常现象吧,于是想别的办法解决,恰巧最近读R几本R语言的入门书,发现prop.table()这个函数是可以实现相关功能的,于是学习使用下。可能你早已会做这个啦,还是分享一下,看看有没有人需要。
直以来,看到这本书《Statistical Analysis of Microbiome Data with R》活跃在朋友圈和公众号,既然口碑这么好,当然有必要学习下啦!分享记录一下书中我所认为重要的点。
更新亮点都有啥呢?大概是几个命令和以前不一样了。
我们知道,不管是16S等扩增子测序,还是宏基因组,最后最重要的结果,就是物种的丰度情况了,qiime2给出的16S丰度结果是一个计数,对于许多软件来说这是可用的,那么如果我们想获得一个直接的百分比数据应该怎样做呢?
这几天随便搜索snp2hla软件的参考数据集的时候发现一个韩国科学家写了一个数据集合并脚本,在使用韩国人样本测试时准确性较分别只用两个未合并的数据集准确性有所提高,于是,就找到了论文提供的脚本合并了一下。
之前做了一个简单的网页,使用23andme格式+snp2hla软件获得hla分型数据,当然准确性不咋的,也就玩玩,上线后为大约100+人提供了服务,这是伯值得骄傲的事,因为第一次能为大家提供服务。代码我是放在了gitHub的,数据是脚本处理完后自动删除。看网页是不是有点眼熟,这是谷歌中国网页框架,直接搬来的。