发现搜索引擎是个神奇的东西,偶然想起的关键词一搜索,获得的就是意想不到的结果,我以imputation+qc搜索,就找到了snpQT(发音Snip Cute)这样一个神奇的工具/流程。这个流程的目的是让你的SNP cute,为处理人类基因变异提供了帮助:
-
基因组版本转换(b37->b38或者反过来) -
样本质控 -
人群分层 -
填充前质控 -
本地填充 -
填充后质控 -
GWAS 使用自动化的nextflow流程,我们在Singularity容器或 Anaconda 环境中运行一系列版本的生物信息学软件,以提高可靠性和可重复性。
snpQT的目标用户:
如是你有如下的想法,它也许是有用的:
-
使用可重复、快速和全面的流程获得一个干净的基因组数据集 -
对识别某个特征的重要 Snp 关联有兴趣 -
想要根据祖源识别和删除离群值 -
想要本地填充 -
您希望准备您的基因组数据集,以便在外部服务器中进行引种(遵循全面的 QC 和填充前 QC 准备)
你需要怎样开始
-
已经获得snp,基于b37/38 -
变异为vcf/plink格式 -
变异有rs号 -
样本有二分类/数量性状 如果你符合以上几点,看看文档吧:https://snpqt.readthedocs.io/en/latest/snpQT可能对你没用,如果你想: -
原始序列质控 -
call变异 -
家系GWAS -
非人基因组数据
引用:
好像并没有发表在好的杂志上,康奈尔大学团队做的。Vasilopoulou C, Wingfield B, Morris AP and Duddy W. snpQT: flexible, reproducible, and comprehensive quality control and imputation of genomic data [version 1; peer review: 2 approved with reservations]. F1000Research 2021, 10:567 (https://doi.org/10.12688/f1000research.53821.1)
证书和第三方软件
GPL3,流程离不开以下第三方软件,看起来还版本还挺新的:
Software | Version | Reference | License |
---|---|---|---|
EIGENSOFT | 7.2.1 | Price, Alkes L., et al. “Principal components analysis corrects for stratification in genome-wide association studies.” Nature genetics 38.8 (2006): 904-909. | Custom open source |
impute5 | 1.0 | Rubinacci, Simone, Olivier Delaneau, and Jonathan Marchini. “Genotype imputation using the positional burrows wheeler transform.” PLoS Genetics 16.11 (2020): e1009049.APA | Academic use only |
nextflow | 20.10.0 | Di Tommaso, Paolo, et al. “Nextflow enables reproducible computational workflows.” Nature biotechnology 35.4 (2017): 316-319. | GPL3 |
picard | 2.24.0 | MIT | |
PLINK | 1.90b6.18 | Purcell, Shaun, et al. “PLINK: a tool set for whole-genome association and population-based linkage analyses.” The American journal of human genetics 81.3 (2007): 559-575. | GPL3 |
PLINK2 | 2.00a2.3 | Chang CC, Chow CC, Tellier LCAM, Vattikuti S, Purcell SM, Lee JJ (2015) Second-generation PLINK: rising to the challenge of larger and richer datasets. GigaScience, 4. | GPL3 |
samtools | 1.11 | Danecek, P.et al.(2021). Twelve years of SAMtools and BCFtools.GigaScience,10(2), 1–4 | MIT |
shapeit4 | 4.1.3 | Delaneau, Olivier, et al. “Accurate, scalable and integrative haplotype estimation.” Nature communications 10.1 (2019): 1-10. | MIT |
snpflip | 0.0.6 | https://github.com/biocore-ntnu/snpflip | MIT |
还用了R语言, tidyverse包等。怎样,有没有兴趣用起来呀?
本篇文章来源于微信公众号: 微因