探索消费级基因检测–祖源

祖源是消费级基因检测比较感兴趣的问题,今天我也来学习一下那如何做一个简陋的祖源分析。使用的是SPA(Spatial Ancestry analysis)这个软件,在google中搜索基因型填充无意中搜到了这个软件,由几个作者写成,第一作者还是华人,有点骄傲,可惜没有针对中国人或者东亚人的模型,只有世界和欧洲人的模型,瞬间又觉得有点失落,好在许多中国公司在积累了几万以上的数据后也开始进行中国人自己的模型构建,而且做得还不错。
先把软件官网放在这,http://genetics.cs.ucla.edu/spa
下面来根据官网步骤来操作一下:

1. 自己的数据结果,aff的芯片

./spa --mfile 23andMe.txt --model-input world.model --location-output world.loc
./spa --mfile 23andMe.txt --model-input europe.model --location-output europe.loc
./spa --mfile 23andMe.txt --model-input world.model --location-output world.loc -n 2
./spa --mfile 23andMe.txt --model-input europe.model --location-output europe.loc -n 2

2.中国人23andme的结果

运行结果,有点差强人意呀,用世界模型,可用点只有20万/50万,把祖源放在了太平洋上。。。,用欧洲模型,可用点有50万+,把祖源定位在了阿尔及得亚。找个真正的23andme数据试试看,从网上找到一个数据,同样命令,开始测试。
世界模型,太平洋中部位置,欧洲模型,同样是地中海附近,竟然在海上,也是醉了,对于中国人不能用,鉴定完毕。

3.欧洲人的结果

从网上下载了个欧洲人的23andme的结果,测试下:
使用欧洲模型,可以定位到法国北部马上到英吉利海峡的样子,还可以,用世界模型,跑北大西洋去了,这个软件不太适合分析snp芯片的数据,大概我认为是这样了。

发表评论

电子邮件地址不会被公开。 必填项已用*标注