qiime2学习笔记(二)

1. 序列质控及Feature表构建

导入数据之后便是质控了。

这次不用测试数据了,用实际数据跑一下,所以同样重复之前的步骤,把fastq文件压缩下,然后,生成样本数据列表(ps.不知道fastq文件不压缩可不可以用,有空试下)。依然参考自上篇的统计咨询公众号的文章代码如下:

主要作用是去除低质量序列、嵌合体;再生成OTU表,现在叫Feature表,因为不再使用聚类方法,相当于QIIME时代100%相似度的OTU表。–QIIME2中文帮助文档
gzip *  #gzip压缩文件夹里所有的数据
source activate qiime2-2018.2 #激活qiime2环境
##1## import data
qiime tools import  \
 --type 'SampleData[PairedEndSequencesWithQuality]'  \
 --input-path 171213_16s-manifest  \
 --output-path 171213_16s.qza  \
 --source-format PairedEndFastqManifestPhred33
##2## quality control
#visualization
qiime demux summarize \
--i-data 171213_16s.qza\
 --o-visualization 171213_16s.qzv
##3##filter 聚类
qiime dada2 denoise-paired \
--i-demultiplexed-seqs 171213_16s.qza \
--p-trunc-len-f 0 \
--p-trunc-len-r 0 \
--o-representative-sequences rep-seqs-dada2.qza \ #输出feature表代表序列
--o-table table-dada2.qza \ #输出表
--p-n-threads 36 #36线程,服务器是40线程的
#qzv 可视化
qiime feature-table summarize \
--i-table table-dada2.qza \
--o-visualization table-dada2.qzv

2.导出数据

这里顺便学习一下导出数据,毕竟qiime2全部是专有格式的文件,不导出没办法在外部查看。到这里,没有中文的相关参考了,直接去学习qiime2官方文档。命令比较简单,就是qiime tools export 后面加上文件等参数就行了。

qiime tools export \
  feature-table.qza \
  --output-dir exported-feature-table

运行后导出了一个biom格式的文件。还是比较亲切的格式。

3.metadata 实验设计

文档介绍说类似于qiime1的mappingfile,只不过是tsv格式的,还兼容mapping文件的。文件长得这样:

这个文件对于我来说好你暂时没有用到,所以暂时没有创建,不知道后边会不会卡脖子,因为我用到的是分好的样品数据,没有进行分数据的步骤。

发表评论

电子邮件地址不会被公开。 必填项已用*标注