继续学习–生信

最近从图书馆借了《生物信息学(第2版)》国防科大刘伟主编的,继续我的学习之路。我是图书馆有啥新书就借来读读,一来比较喜欢新书,二来这书好像也不怎么热,能借得到,虽然好多内容是重复,也有新东西可学的快感,顺便复习一下也不错。这次,我看到了weka,学习一下!

继续阅读 →

一个ubiome原始数据分析学习记录

最近在github上找到一个ubiome的原始数据,包含多个身体部位的,尝试分析一下,看看能获得什么结果。经历了那么多的安装坑,发现还是docker的安装方式最方便有效、节省时间,特别是换上国内的加速源之后。虚拟机太占资源,而且总感觉虚拟机不够真实,conda安装完竟然也总是报错,特别是更新2个月一次如此频繁的qiime2。

继续阅读 →

SNP2HLA学习笔记2

HLA基因,位于6号染色体上短臂上,长约4000Kb。HLA是目前所知人体最复杂的遗传多态性系统,有几十个基因座位,每个基因座位又有几十个等位基因,且呈共显性表达。由于MHC基因位于同一条染色体上,其多基因座位上的基因型组合相对稳定,很少发生同源染色体间交换,这就构成了以单元型(HAPLOTYPE,即在同一条染色体上紧密连锁的一系列等位基因的特殊组合)为特征的遗传。按中国人常见的A座位基因有13个,B座位基因有30个计算,可组成的单元型约有13×30=390种之多。
snp2hla是大名鼎鼎的Broad研究所开发的,通过snp分型数据来获得HLA分型信息的软件。它的准确度主要依赖于一个尽可能大的,针对特定民族人群的参考数据集。

继续阅读 →

ASA芯片的探索

gsa芯片作为一款消费级基因检测市场上具有较高性价比的芯片,已经成为国内外多家基因检测公司的首选,不得不承认illumina的强大。毕竟,这是人家的看家本领,二代测序技术还是买来的呢。说句题外话,发现好多技术原创于英国,比如arm,纳米孔测序,sanger测序。。。最近,gsa芯片已经升级为ASA芯片,增加了许多位点,那么,我们来看下,ASA相比GSA的变化在哪呢?

继续阅读 →