直以来,看到这本书《Statistical Analysis of Microbiome Data with R》活跃在朋友圈和公众号,既然口碑这么好,当然有必要学习下啦!分享记录一下书中我所认为重要的点。
更新亮点都有啥呢?大概是几个命令和以前不一样了。
我们知道,不管是16S等扩增子测序,还是宏基因组,最后最重要的结果,就是物种的丰度情况了,qiime2给出的16S丰度结果是一个计数,对于许多软件来说这是可用的,那么如果我们想获得一个直接的百分比数据应该怎样做呢?
这几天随便搜索snp2hla软件的参考数据集的时候发现一个韩国科学家写了一个数据集合并脚本,在使用韩国人样本测试时准确性较分别只用两个未合并的数据集准确性有所提高,于是,就找到了论文提供的脚本合并了一下。
之前做了一个简单的网页,使用23andme格式+snp2hla软件获得hla分型数据,当然准确性不咋的,也就玩玩,上线后为大约100+人提供了服务,这是伯值得骄傲的事,因为第一次能为大家提供服务。代码我是放在了gitHub的,数据是脚本处理完后自动删除。看网页是不是有点眼熟,这是谷歌中国网页框架,直接搬来的。
最近听了菲沙基因的网课,记录一下!多数是其课程ppt的截图,如有侵权,立马删除。声明,和这个公司无利益相关,只是为了学习和分享知识。
生活中,你一定对酸奶不陌生,早在古时候先辈们已经制作酸奶了。在中国,酸奶有史可查的最早记录是在公元5世纪,贾思勰在《齐民要术》中记载了齐地酸奶的制作方法。而酸奶中最常见的几种菌就是保加利亚乳杆菌、嗜热链球菌、乳酸乳球菌等了。
除了引用最多的qiime流程,u/vsearch(usearch是一人一已之力单挑学术界)和mothur(用的人越来越少的感觉),最近又发现了一两个流程,一并分享给大家。
这是我两三年前学习过的一本书,我觉得这本书挺好,把生物学的问题直接在python学习中解决了,推荐给大家,之前还整理了习题代码,分享一下。之前分享在了github上,收获了10颗星,惭愧,已经是我最多星的一个。还有一两个习题记得没有解答出来,如果你解答出来了,欢迎交流!代码有的肯定不是最优的,只是一种解答方法,可能有错误,也欢迎指正,谢谢!我坚信分享使我们快乐,加油!我是用python3完成的,当然二者区别也很小(目前我基本只认识到了print函数的区别),除非遇上那种多年不遇的bug。
最近有朋友和我交流纳米孔16S测序数据的分析,发现真的没有从头完成过一次这方面的数据分析,然后发现这方面的资料也比较少,于是学习一下,和大家分享。坦白说,牛津纳米孔测序技术在16S多样性研究方面还是有些不足的,只能说勉强够用,主要应用场景是在一些现场快速检测方面,主要是病原菌这种。但是,相信随着测序准确度的提高和分析软件的改进,相信它的应用会越来越多。感谢互联网的便利和分享精神,今天的我们可以方便地获得测序的原始数据,并可以自由进行分析。