qiime再学习

所谓“书到用时方恨少,绝知此事要躬行”,手上拿到测序数据才深深地感受到了这一点,本来以为挺简单的问题,具体针对这个项目又有小难题挡路,于是读教程,读文档,抓紧搞定。

1. qiime1数据导入

手上的数据是分好样本的,不需要用qiime再次分了,于是就查文档,找到一个multiple_split_libraries_fastq.py命令,刚好可以解决我的问题,还可以使用文件名自动区分样本。
multiple_split_libraries_fastq.py -i ./ -o qiime1
--demultiplexing_method sampleid_by_file

2. qiime2数据导入

qiime2的数据导入同样发现有新的方式,好吧,是我自己孤陋寡闻了,这个方式,只要每个文件命名方式遵循qiime2的命名规范就可以。
命名规范为以下划线分隔,样本名_lane名_R1_001.fastq.gz,如L2S357_15_L001_R1_001.fastq.gz

qiime tools import \
--type 'SampleData[PairedEndSequencesWithQuality]' \
--input-path casava-18-paired-end-demultiplexed \
--input-format CasavaOneEightSingleLanePerSampleDirFmt \
--output-path demux-paired-end.qza

SE的数据就是把PairedEnd去掉就好了,不过现在估计一般也没人只测单向数据了吧。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注