发现这个软件之前的官网已经打不开,但是在github上仍然在更新,https://github.com/SyntekabioTools/HLAscan或许是换了工作?最近一次更新是2019.12.4,还是比较新的。发现wegene的NGS HLA分型报告是用的这个软件的参考文献,估计还是权威些的。
这几天随便搜索snp2hla软件的参考数据集的时候发现一个韩国科学家写了一个数据集合并脚本,在使用韩国人样本测试时准确性较分别只用两个未合并的数据集准确性有所提高,于是,就找到了论文提供的脚本合并了一下。
可以用snp芯片数据(wegene、23mofang、illumina(ASA、GSA)和affimetrics的均可)实现HLA分型,任意的SNP芯片,只要位点数足够即可(几十万)。
HLA基因,位于6号染色体上短臂上,长约4000Kb。HLA是目前所知人体最复杂的遗传多态性系统,有几十个基因座位,每个基因座位又有几十个等位基因,且呈共显性表达。由于MHC基因位于同一条染色体上,其多基因座位上的基因型组合相对稳定,很少发生同源染色体间交换,这就构成了以单元型(HAPLOTYPE,即在同一条染色体上紧密连锁的一系列等位基因的特殊组合)为特征的遗传。按中国人常见的A座位基因有13个,B座位基因有30个计算,可组成的单元型约有13×30=390种之多。
snp2hla是大名鼎鼎的Broad研究所开发的,通过snp分型数据来获得HLA分型信息的软件。它的准确度主要依赖于一个尽可能大的,针对特定民族人群的参考数据集。
之前测试了一下使用humanlongev…