Mothur学习笔记

最近有点好奇,仅次于qiime的Mothur,用起来感觉如何,于是决定尝试下。虽然qiime还没有学会学透,但人活着就要折腾嘛,否则与咸鱼有什么区别,哈哈。

1.下载地址

Github项目地址–https://github.com/mothur/mothur

软件下载地址:https://github.com/mothur/mothur/releases/download/v1.40.5/Mothur.win_64.zip

p.s.这次决定用win10试试,我把thinkpad-额31上的12G内存分了4g给另一台电脑联想C2030,8g内存分析扩增子数据应该ok了。

2.安装和使用

安装就很简单了,解压到一个文件夹就哦了,然后,双击mothur.exe,竟然跳出一个cmd窗口,挺好的,门槛较低。

 

2.下面学习一下使用

2.1 下载示例数据

有两个版本,一个分好的,另一个是原始文件。

分好的样本数据:https://www.mothur.org/w/images/d/d6/MiSeqSOPData.zip

解压得到21对PEfastq数据,放在mothur程序文件夹。

原始文件:http://www.mothur.org/MiSeqDevelopmentData/StabilityNoMetaG.tar

解压得到362对PEfastq数据

make.file命令生成stability.files,这个应该是文件列表文件吧。

#1. make.file命令获得数据文件列表
make.file(inputdir=MiSeq_SOP, type=fastq, prefix=stability)
#2. 减少测序和pcr错误
 make.contigs(file=stability.files, processors=4)
#3. 查看处理统计
summary.seqs(fasta=stability.trim.contigs.fasta)
#4. 去除拼接不好的,含N的,过长的序列 ,两个命令二选一,每二个快点,因为调用了之前的统计文件
screen.seqs(fasta=stability.trim.contigs.fasta, group=stability.contigs.groups, maxambig=0, maxlength=275)
screen.seqs(fasta=stability.trim.contigs.fasta, group=stability.contigs.groups, summary=stability.trim.contigs.summary, maxambig=0, maxlength=275)
#mothur可以自动记住软件参数,比如:
get.current()
Current RAM usage: 3.40499 Gigabytes. Total Ram: 7.88905 Gigabytes.

Current files saved by mothur:
accnos=MiSeq_SOP\stability.trim.contigs.bad.accnos
fasta=MiSeq_SOP\stability.trim.contigs.good.unique.fasta
group=MiSeq_SOP\stability.contigs.good.groups
name=MiSeq_SOP\stability.trim.contigs.good.names
qfile=MiSeq_SOP\stability.trim.contigs.qual
contigsreport=MiSeq_SOP\stability.contigs.report
count=MiSeq_SOP\stability.trim.contigs.good.count_table
processors=4
summary=MiSeq_SOP\stability.trim.contigs.good.unique.summary
file=MiSeq_SOP\stability.files

Current input directory saved by mothur: MiSeq_SOP\

Current default directory saved by mothur: D:\软件源文件\mothur\

Current working directory: D:\软件源文件\mothur\

Output File Names:
current_files.summary
#5. 处理过滤后的序列
#获取唯一序列
unique.seqs(fasta=stability.trim.contigs.good.fasta)
#计数
count.seqs(name=stability.trim.contigs.good.names, group=stability.contigs.good.groups)
#统计结果
summary.seqs(count=stability.trim.contigs.good.count_table)
#制作比对数据库,参数暂未搞清楚,应该是其中的细菌序列
pcr.seqs(fasta=silva.bacteria.fasta, start=11894, end=25319, keepdots=F, processors=4)
#文件重命名
rename.file(input=silva.bacteria.pcr.fasta, new=silva.v4.fasta)
#再次统计

summary.seqs(fasta=silva.v4.fasta)
#比对
align.seqs(fasta=stability.trim.contigs.good.unique.fasta, reference=silva.v4.fasta)
#统计比对情况
 summary.seqs(fasta=stability.trim.contigs.good.unique.align, count=stability.trim.contigs.good.count_table)

 

关于 “Mothur学习笔记” 的 2 个意见

  1. 最近在寻找HLA分型的软件,但是出现了一些问题,在你的博客上看到你已经正常使用了一些软件,所以有一些问题想要请教你

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注