1. 序列质控及Feature表构建
导入数据之后便是质控了。
这次不用测试数据了,用实际数据跑一下,所以同样重复之前的步骤,把fastq文件压缩下,然后,生成样本数据列表(ps.不知道fastq文件不压缩可不可以用,有空试下)。依然参考自上篇的统计咨询公众号的文章代码如下:
主要作用是去除低质量序列、嵌合体;再生成OTU表,现在叫Feature表,因为不再使用聚类方法,相当于QIIME时代100%相似度的OTU表。–QIIME2中文帮助文档
gzip * #gzip压缩文件夹里所有的数据 source activate qiime2-2018.2 #激活qiime2环境 ##1## import data qiime tools import \ --type 'SampleData[PairedEndSequencesWithQuality]' \ --input-path 171213_16s-manifest \ --output-path 171213_16s.qza \ --source-format PairedEndFastqManifestPhred33 ##2## quality control #visualization qiime demux summarize \ --i-data 171213_16s.qza\ --o-visualization 171213_16s.qzv ##3##filter 聚类 qiime dada2 denoise-paired \ --i-demultiplexed-seqs 171213_16s.qza \ --p-trunc-len-f 0 \ --p-trunc-len-r 0 \ --o-representative-sequences rep-seqs-dada2.qza \ #输出feature表代表序列 --o-table table-dada2.qza \ #输出表 --p-n-threads 36 #36线程,服务器是40线程的 #qzv 可视化 qiime feature-table summarize \ --i-table table-dada2.qza \ --o-visualization table-dada2.qzv
2.导出数据
这里顺便学习一下导出数据,毕竟qiime2全部是专有格式的文件,不导出没办法在外部查看。到这里,没有中文的相关参考了,直接去学习qiime2官方文档。命令比较简单,就是qiime tools export 后面加上文件等参数就行了。
qiime tools export \ feature-table.qza \ --output-dir exported-feature-table
运行后导出了一个biom格式的文件。还是比较亲切的格式。
3.metadata 实验设计
文档介绍说类似于qiime1的mappingfile,只不过是tsv格式的,还兼容mapping文件的。文件长得这样:
这个文件对于我来说好你暂时没有用到,所以暂时没有创建,不知道后边会不会卡脖子,因为我用到的是分好的样品数据,没有进行分数据的步骤。