Sliverwork图形化流程使用笔记

图形化生信分析是未来趋势,已经有多家公司开始开发生信分析的图形化解决方案,既有云计算,也有分析一体机,但是好像基本上都推广的不怎么成功。有其封闭性的原因,还有可能是售价太高,对一般公司来说不如多招个生信工程师更划得来,后者还能解决具体问题,比如软件运行过程中的报错,参数可变的个性化分析。

继续阅读 →

Nanopore牛津纳米孔测16S学习笔记

身处这样一个互联网时代,应当感恩技术带来的便利,从在一个地方不远游就只能是井底之蛙,到今天互联网让我们不出门知天下事,当然,假消息也有。虽然现在许多事和技能仍然需要项目实践,但是不得不说,知识已经不再是一种稀缺的资源,需要时间训练的技能才是。我们应该充分利用好这个时代提供给我们的便利,努力学习和思考。

继续阅读 →

继续学习–生信

最近从图书馆借了《生物信息学(第2版)》国防科大刘伟主编的,继续我的学习之路。我是图书馆有啥新书就借来读读,一来比较喜欢新书,二来这书好像也不怎么热,能借得到,虽然好多内容是重复,也有新东西可学的快感,顺便复习一下也不错。这次,我看到了weka,学习一下!

继续阅读 →

一个ubiome原始数据分析学习记录

最近在github上找到一个ubiome的原始数据,包含多个身体部位的,尝试分析一下,看看能获得什么结果。经历了那么多的安装坑,发现还是docker的安装方式最方便有效、节省时间,特别是换上国内的加速源之后。虚拟机太占资源,而且总感觉虚拟机不够真实,conda安装完竟然也总是报错,特别是更新2个月一次如此频繁的qiime2。

继续阅读 →

SNP2HLA学习笔记2

HLA基因,位于6号染色体上短臂上,长约4000Kb。HLA是目前所知人体最复杂的遗传多态性系统,有几十个基因座位,每个基因座位又有几十个等位基因,且呈共显性表达。由于MHC基因位于同一条染色体上,其多基因座位上的基因型组合相对稳定,很少发生同源染色体间交换,这就构成了以单元型(HAPLOTYPE,即在同一条染色体上紧密连锁的一系列等位基因的特殊组合)为特征的遗传。按中国人常见的A座位基因有13个,B座位基因有30个计算,可组成的单元型约有13×30=390种之多。
snp2hla是大名鼎鼎的Broad研究所开发的,通过snp分型数据来获得HLA分型信息的软件。它的准确度主要依赖于一个尽可能大的,针对特定民族人群的参考数据集。

继续阅读 →