Mothur学习笔记

最近有点好奇，仅次于qiime的Mothur，用起来感觉如何，于是决定尝试下。虽然qiime还没有学会学透，但人活着就要折腾嘛，否则与咸鱼有什么区别，哈哈。

1.下载地址

Github项目地址–https://github.com/mothur/mothur

软件下载地址：https://github.com/mothur/mothur/releases/download/v1.40.5/Mothur.win_64.zip

p.s.这次决定用win10试试，我把thinkpad-额31上的12G内存分了4g给另一台电脑联想C2030，8g内存分析扩增子数据应该ok了。

2.安装和使用

安装就很简单了，解压到一个文件夹就哦了，然后，双击mothur.exe，竟然跳出一个cmd窗口，挺好的，门槛较低。

2.下面学习一下使用

2.1 下载示例数据

有两个版本，一个分好的，另一个是原始文件。

分好的样本数据：https://www.mothur.org/w/images/d/d6/MiSeqSOPData.zip

解压得到21对PEfastq数据，放在mothur程序文件夹。

原始文件：http://www.mothur.org/MiSeqDevelopmentData/StabilityNoMetaG.tar

解压得到362对PEfastq数据

make.file命令生成stability.files，这个应该是文件列表文件吧。

#1. make.file命令获得数据文件列表
make.file(inputdir=MiSeq_SOP, type=fastq, prefix=stability)
#2. 减少测序和pcr错误
 make.contigs(file=stability.files, processors=4)
#3. 查看处理统计
summary.seqs(fasta=stability.trim.contigs.fasta)
#4. 去除拼接不好的，含N的，过长的序列 ，两个命令二选一，每二个快点，因为调用了之前的统计文件
screen.seqs(fasta=stability.trim.contigs.fasta, group=stability.contigs.groups, maxambig=0, maxlength=275)
screen.seqs(fasta=stability.trim.contigs.fasta, group=stability.contigs.groups, summary=stability.trim.contigs.summary, maxambig=0, maxlength=275)
#mothur可以自动记住软件参数，比如：
get.current()
Current RAM usage: 3.40499 Gigabytes. Total Ram: 7.88905 Gigabytes.

Current files saved by mothur:
accnos=MiSeq_SOP\stability.trim.contigs.bad.accnos
fasta=MiSeq_SOP\stability.trim.contigs.good.unique.fasta
group=MiSeq_SOP\stability.contigs.good.groups
name=MiSeq_SOP\stability.trim.contigs.good.names
qfile=MiSeq_SOP\stability.trim.contigs.qual
contigsreport=MiSeq_SOP\stability.contigs.report
count=MiSeq_SOP\stability.trim.contigs.good.count_table
processors=4
summary=MiSeq_SOP\stability.trim.contigs.good.unique.summary
file=MiSeq_SOP\stability.files

Current input directory saved by mothur: MiSeq_SOP\

Current default directory saved by mothur: D:\软件源文件\mothur\

Current working directory: D:\软件源文件\mothur\

Output File Names:
current_files.summary
#5. 处理过滤后的序列
#获取唯一序列
unique.seqs(fasta=stability.trim.contigs.good.fasta)

#计数
count.seqs(name=stability.trim.contigs.good.names, group=stability.contigs.good.groups)
#统计结果
summary.seqs(count=stability.trim.contigs.good.count_table)
#制作比对数据库，参数暂未搞清楚，应该是其中的细菌序列
pcr.seqs(fasta=silva.bacteria.fasta, start=11894, end=25319, keepdots=F, processors=4)
#文件重命名
rename.file(input=silva.bacteria.pcr.fasta, new=silva.v4.fasta)
#再次统计

summary.seqs(fasta=silva.v4.fasta)
#比对
align.seqs(fasta=stability.trim.contigs.good.unique.fasta, reference=silva.v4.fasta)
#统计比对情况
 summary.seqs(fasta=stability.trim.contigs.good.unique.align, count=stability.trim.contigs.good.count_table)

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

文章

关于 “Mothur学习笔记” 的 2 个意见

发表回复取消回复

关于 “Mothur学习笔记” 的 2 个意见

发表回复 取消回复

发表回复取消回复