宏基因组分析,首先需要的结果是获得物种分类信息,前面我们提到,宏基因组有两种分析方式分别是基于序列比对和组装的,组装对电脑硬件的要求是超级高的,不过比对,就轻松多了,得益于算法的优化,有的软件可以实现在个人电脑上进行分析。最近的“AMD YES”也很给力,把普通个人电脑推向了8核16G RAM这种配置,终于追上了手机(虽然二者性能不可同日而语)。算力有了,充分利用起来呀,来个宏基因组玩玩呀!
更新亮点都有啥呢?大概是几个命令和以前不一样了。
最近听了菲沙基因的网课,记录一下!多数是其课程ppt的截图,如有侵权,立马删除。声明,和这个公司无利益相关,只是为了学习和分享知识。
除了引用最多的qiime流程,u/vsearch(usearch是一人一已之力单挑学术界)和mothur(用的人越来越少的感觉),最近又发现了一两个流程,一并分享给大家。
最近看到生信技能树的一篇推文在介绍nf-core这个流程管理工具,发现官方有qiime2的流程,学习一下,顺便探索一下中间的坑。关于nf-core,这篇推文已经介绍的够多了,我这里主要学习它的搭建和使用。
最近需要下载千人基因组计划中的中国人数据作为参考,于是学习了下几个下载方法。发现还是有几个小技巧值得分享的,就记录分享一下!我找到的主要方法有两三个,分别是通过网页下载,API批量下载和ftp批量下载。
图形化生信分析是未来趋势,已经有多家公司开始开发生信分析的图形化解决方案,既有云计算,也有分析一体机,但是好像基本上都推广的不怎么成功。有其封闭性的原因,还有可能是售价太高,对一般公司来说不如多招个生信工程师更划得来,后者还能解决具体问题,比如软件运行过程中的报错,参数可变的个性化分析。
身处这样一个互联网时代,应当感恩技术带来的便利,从在一个地方不远游就只能是井底之蛙,到今天互联网让我们不出门知天下事,当然,假消息也有。虽然现在许多事和技能仍然需要项目实践,但是不得不说,知识已经不再是一种稀缺的资源,需要时间训练的技能才是。我们应该充分利用好这个时代提供给我们的便利,努力学习和思考。
最近比较令人无语的是anaconda的镜像一个接一个的倒下,商业公司的东西有时真的是很不靠谱,这也是我们为什么相信开源。
这两天在用mac下载ena的fastq数据,发现aspera connect,windows和mac版本的死活不会用呢,于是就学习了一下,发现一样是可以使用命令行的,这里是mac的,后面再整理下win的。