ubiome类似数据dada2处理探索2

还是接着之前的事说,首先,在researchgte网站上发现了一个小“新大陆”,说可以把不能很好拼接的数据直接N连接处理。这里就先按软件默认的加几个N了,虽然拼接率有3%。。。然后,找到了直接加N的软件,不重复造轮子,自己写拼接脚本还是要费半天时间的,不如用工具,既好又准。

继续阅读 →

Sliverwork图形化流程使用笔记

图形化生信分析是未来趋势,已经有多家公司开始开发生信分析的图形化解决方案,既有云计算,也有分析一体机,但是好像基本上都推广的不怎么成功。有其封闭性的原因,还有可能是售价太高,对一般公司来说不如多招个生信工程师更划得来,后者还能解决具体问题,比如软件运行过程中的报错,参数可变的个性化分析。

继续阅读 →

PRS多基因评分教程学习笔记

最近发现PRS是近两年比较热门的领域,从科学家对糖尿病等几种疾病的评分,到23andme对糖尿病的评估,发表的文章也越来越多,有必要学习一下他的基本过程。这里找到了一个比较详细的教程,学习和记录一下。教程是一个毕业于香港大学的博士写的,还是PRS分析软件PRSice-2的作者之一,地址放在这:https://choishingwan.github.io/PRS-Tutorial/ 。这篇教程是以同作者发表在生物预印本上的一篇文章为蓝本写的,教程更加详细,示例数据和步骤详尽,可以保证每个人从头重复到尾,而且分别介绍了三种方法的使用,值得学习一下。教程需要R语言和plink,以及LDpred和lassosum软件。

继续阅读 →

使用melonnpan通过扩增子或宏基因组测序数据有效预测微生物群落的代谢图谱

热心肠研究院的这个介绍让我对这个软件产生了好奇,我决定学习一下这个软件的使用,看看它和picrust的区别在哪,picrust2刚刚发布,看看是棋逢对手还是略胜一筹呢。后来发现,好吧,最后发现一个实验室开发的。。。区别在于一个是完全基于已知的参考数据库,而这个目标是发现是大多数(>60%)未注释基因家族与代谢物相对丰度的关联。

继续阅读 →