母系祖源之线粒体探寻

对于一个不提供太多分析,而可以提供原始数据的消费级基因检测,我们可以做许多探索,来满足自己的好奇心,以及对自己了解更多。这或许是未来一个生物极客的必备素质。前面简单探索了一下Y单体型,今天探索一下线粒体祖源的情况,众所周知,和Y染色体的父系遗传相对应,线粒体是母系遗传的,只有母亲会传给孩子,所以,这会一步步追溯到最早的母亲。
工具的获得在这个网站:https://isogg.org/wiki/MtDNA_tools

不得不说这个网站真的是一个很好的网站,从名字来看它是一个专门研究家谱学(genealogy)的网站,还发表了论文,是由一个非营利组织创办,我觉得应该是和开源软件是一个精神的。还发现国内有个类似的网站,但是活跃度没这个给力,而且主要是关于Y染色体遗传方面的。http://www.ranhaer.com/forum.php

这个软件推荐的首选工具是中国台湾的黎先生开发的一个网页工具,https://dna.jameslick.com/mthap ,是支持23andme这种格式的原始数据的。但我测试下来的结果是,网页可以正常打开,上传数据不工作,提示网页无响应,只好作罢,还发了邮件求助,但是没回应。

然后,继续寻找一个可以实现线粒体分型的工具,发现https://haplogrep.uibk.ac.at/ 这个工具可以实现23andme格式数据的分型,不过要稍做处理,转换成vcf格式的。这里我发现在github上有好几个可以实现这个功能的小工具,用下来发现我前面用的这个最方便https://github.com/acflewis/23andme_to_VCF ,其他的不是失败,就是要下很大的数据集。方便也是有代价的,这个工具只包含23andme的芯片数据,所以会损失一定数据的点,对于我的线粒体来说,损失了200个,1/5的样子,不过还好,没有影响结果的得出,当然,可能影响准确性。

一个简单的命令后,就得出了结果:

祖源是一门学科,当然不是一个软件就能了解的,需要长时间的学习和知识积累,今天,是我的起步。附上其他后面感性趣的可以继续探索的网址:
https://isogg.org/wiki/Autosomal_DNA_tools
https://isogg.org/wiki/Raw_DNA_data_tools
https://www.cog-genomics.org/plink2/input#23file

发表评论