最近有点好奇,仅次于qiime的Mothur,用起来感觉如何,于是决定尝试下。虽然qiime还没有学会学透,但人活着就要折腾嘛,否则与咸鱼有什么区别,哈哈。
1.下载地址
Github项目地址–https://github.com/mothur/mothur
软件下载地址:https://github.com/mothur/mothur/releases/download/v1.40.5/Mothur.win_64.zip
p.s.这次决定用win10试试,我把thinkpad-额31上的12G内存分了4g给另一台电脑联想C2030,8g内存分析扩增子数据应该ok了。
2.安装和使用
安装就很简单了,解压到一个文件夹就哦了,然后,双击mothur.exe,竟然跳出一个cmd窗口,挺好的,门槛较低。
2.下面学习一下使用
2.1 下载示例数据
有两个版本,一个分好的,另一个是原始文件。
分好的样本数据:https://www.mothur.org/w/images/d/d6/MiSeqSOPData.zip
解压得到21对PEfastq数据,放在mothur程序文件夹。
原始文件:http://www.mothur.org/MiSeqDevelopmentData/StabilityNoMetaG.tar
解压得到362对PEfastq数据
make.file命令生成stability.files,这个应该是文件列表文件吧。
#1. make.file命令获得数据文件列表 make.file(inputdir=MiSeq_SOP, type=fastq, prefix=stability) #2. 减少测序和pcr错误 make.contigs(file=stability.files, processors=4) #3. 查看处理统计 summary.seqs(fasta=stability.trim.contigs.fasta) #4. 去除拼接不好的,含N的,过长的序列 ,两个命令二选一,每二个快点,因为调用了之前的统计文件 screen.seqs(fasta=stability.trim.contigs.fasta, group=stability.contigs.groups, maxambig=0, maxlength=275) screen.seqs(fasta=stability.trim.contigs.fasta, group=stability.contigs.groups, summary=stability.trim.contigs.summary, maxambig=0, maxlength=275) #mothur可以自动记住软件参数,比如: get.current() Current RAM usage: 3.40499 Gigabytes. Total Ram: 7.88905 Gigabytes. Current files saved by mothur: accnos=MiSeq_SOP\stability.trim.contigs.bad.accnos fasta=MiSeq_SOP\stability.trim.contigs.good.unique.fasta group=MiSeq_SOP\stability.contigs.good.groups name=MiSeq_SOP\stability.trim.contigs.good.names qfile=MiSeq_SOP\stability.trim.contigs.qual contigsreport=MiSeq_SOP\stability.contigs.report count=MiSeq_SOP\stability.trim.contigs.good.count_table processors=4 summary=MiSeq_SOP\stability.trim.contigs.good.unique.summary file=MiSeq_SOP\stability.files Current input directory saved by mothur: MiSeq_SOP\ Current default directory saved by mothur: D:\软件源文件\mothur\ Current working directory: D:\软件源文件\mothur\ Output File Names: current_files.summary #5. 处理过滤后的序列 #获取唯一序列 unique.seqs(fasta=stability.trim.contigs.good.fasta)
#计数 count.seqs(name=stability.trim.contigs.good.names, group=stability.contigs.good.groups) #统计结果 summary.seqs(count=stability.trim.contigs.good.count_table) #制作比对数据库,参数暂未搞清楚,应该是其中的细菌序列 pcr.seqs(fasta=silva.bacteria.fasta, start=11894, end=25319, keepdots=F, processors=4) #文件重命名 rename.file(input=silva.bacteria.pcr.fasta, new=silva.v4.fasta) #再次统计 summary.seqs(fasta=silva.v4.fasta) #比对 align.seqs(fasta=stability.trim.contigs.good.unique.fasta, reference=silva.v4.fasta) #统计比对情况 summary.seqs(fasta=stability.trim.contigs.good.unique.align, count=stability.trim.contigs.good.count_table)
最近在寻找HLA分型的软件,但是出现了一些问题,在你的博客上看到你已经正常使用了一些软件,所以有一些问题想要请教你
欢迎交流和相互学习。zd200572 163.com 空格换成@