如果你不懂代码,不懂网站规则,那么最简单的就是直接使用UCSC xena 浏览器啦!!!网站;https://xenabrowser.net/datapages/ 理论上也可以完成大部分数据探索的,甚至还有一些sci文章发表就是完完全全使用这个网页工具。
最近从图书馆借了《生物信息学(第2版)》国防科大刘伟主编的,继续我的学习之路。我是图书馆有啥新书就借来读读,一来比较喜欢新书,二来这书好像也不怎么热,能借得到,虽然好多内容是重复,也有新东西可学的快感,顺便复习一下也不错。这次,我看到了weka,学习一下!
可以用snp芯片数据(wegene、23mofang、illumina(ASA、GSA)和affimetrics的均可)实现HLA分型,任意的SNP芯片,只要位点数足够即可(几十万)。
最近在github上找到一个ubiome的原始数据,包含多个身体部位的,尝试分析一下,看看能获得什么结果。经历了那么多的安装坑,发现还是docker的安装方式最方便有效、节省时间,特别是换上国内的加速源之后。虚拟机太占资源,而且总感觉虚拟机不够真实,conda安装完竟然也总是报错,特别是更新2个月一次如此频繁的qiime2。
最近有点好奇,仅次于qiime的Mothur,用起来感觉如何,于是决定尝试下。虽然qiime还没有学会学透,但人活着就要折腾嘛,否则与咸鱼有什么区别,哈哈。
HLA基因,位于6号染色体上短臂上,长约4000Kb。HLA是目前所知人体最复杂的遗传多态性系统,有几十个基因座位,每个基因座位又有几十个等位基因,且呈共显性表达。由于MHC基因位于同一条染色体上,其多基因座位上的基因型组合相对稳定,很少发生同源染色体间交换,这就构成了以单元型(HAPLOTYPE,即在同一条染色体上紧密连锁的一系列等位基因的特殊组合)为特征的遗传。按中国人常见的A座位基因有13个,B座位基因有30个计算,可组成的单元型约有13×30=390种之多。
snp2hla是大名鼎鼎的Broad研究所开发的,通过snp分型数据来获得HLA分型信息的软件。它的准确度主要依赖于一个尽可能大的,针对特定民族人群的参考数据集。
之前有个软件SNP2HLA可以把snp芯片的结果转化成HLA分型的,软件数据库里面还有中国人的数据集,相对准确,可以分到每个基因座两位,准确度因基因座而不同,还有个网站,也可以实现将23andme等的结果提取出HLA型。
用脚本和linux命令简单统计了一个这个消费级基因检测芯片的60万位点的分布情况。
gsa芯片作为一款消费级基因检测市场上具有较高性价比的芯片,已经成为国内外多家基因检测公司的首选,不得不承认illumina的强大。毕竟,这是人家的看家本领,二代测序技术还是买来的呢。说句题外话,发现好多技术原创于英国,比如arm,纳米孔测序,sanger测序。。。最近,gsa芯片已经升级为ASA芯片,增加了许多位点,那么,我们来看下,ASA相比GSA的变化在哪呢?
bioconda是conda上一个分发生…