探索一个消费级基因检测结果——HLA

之前有个软件SNP2HLA可以把snp芯片的结果转化成HLA分型的,软件数据库里面还有中国人的数据集,相对准确,可以分到每个基因座两位,准确度因基因座而不同,还有个网站,也可以实现将23andme等的结果提取出HLA型。下面我测试一下:

1、网站

网站的方法,简单易行,虽然可能准确度有点问题,先试试。http://hla.nicokist.com/

之前找到过一次,现在找不到了,github是个东西,终于在上面找到了,ps他最近被微软收购了,不知未来如何啊。话说这个网页是采用HIBAG这个R包实现的,看名字应该是个中国人或者华人写的,点赞一个!

话说这个芯片的数据有部分是sgi开头的,估计是公司自己加上去的,不清楚是什么含义的情况下,先用一个超级简单的python脚本去掉,脚本如下:

fout = open('ywc-drop-sgi.txt', 'w')

with open('ywc.txt') as f:
	for line in f:
		if line.startswith('sgi'):
			continue
		else:
			fout.write(line)

fout.close()

好吧,还是不行,去掉没有分出结果的‘–’的位点,还是报错。很遗憾地表示,不管怎样修改数据格式,就是说不能读取23andMe数据(Error: Could not read 23andMe data file.),只好放弃了。看它的示例数据只有A、B、C三个基因座的结果,结果准确性偏低的。

今天逛wegene论坛又发现一个可以将wegene的数据转换成23的,试试行不行,地址地这:http://joshua.galaxy.42dna.com/wgto23/

竟然成功了,结果类似上面的,虽然只有01, 0.59和0.85的准确率。

2、SNP2HLA

这个软件安装比较简单的,下载下来直接用。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注