前言

龙星课程在哈尔滨工业大学的航天馆正如火如荼的进行着:

2017龙星课程系列(二)_Java


本次龙星课程主要讲的是癌症基因组分析中的算法,主要从4个方面进行阐释。

 

  1. Background of cancer biologyand cancer genomics 癌症基因组与癌症生物学的背景

  2. Algorithms to study inter-tumorheterogeneity 瘤间的异质性的算法

  3. Network related algorithms incancer genomics 癌症相关网络的算法

  4. Algorithms to study complexgenomic alterations and  intra-tumorheterogeneity研究基因组改变的算法和瘤内异质性



1 癌症基因组 


首先,在此简单介绍一下癌症基因组。


癌症基因组概览:染色体内的重排,染色质间的重拍,点突变,拷贝数的改变。

2017龙星课程系列(二)_Java_02

一些重要基因的改变会驱使细胞生长,呈现一种癌症的表型。

这些基因包括:

1、原癌基因:当发生突变或者高表达的时候,导致正常细胞向肿瘤细胞转变。

2、肿瘤抑制基因:一类,可以抑制正常细胞生长的基因

3、修复基因:可以修复DNA的损伤或者错误。


正常组织中,原癌基因与肿瘤抑制基因相辅相成,共同调控细胞生长。但在癌症中,原癌基因突变使其活性增强,肿瘤抑制基因的突变或失去,导致功能丧失,细胞生长失调,导致恶性肿瘤

2017龙星课程系列(二)_Java_03

1 肿瘤间异质性 


以研究肿瘤间异质性的算法为例简单介绍一下,肿瘤异质性一直是癌症基因组分析中的一个热点与关键,以下是几种常用的方法。


1、聚类:可以发现成簇的基因或者样本分组

对于基因表达谱数据,聚类可以通过相似的基因表达,得到功能相关的基因通过表达相似,可以预测未知基因的功能;通过表达相似,可以基因可能调控的其他基因。样本聚成一簇,说明样本有着相似的临床特征。常用的聚类算法,有层次聚类,K均值聚类


2、而Somatic mutation也是肿瘤异质性的一个重要原因,SV既可以作为driver mutation 也可以作为passenger mutation。

检测driver mutation 方法,分为以下几种:有基于序列的方法,机器学习的方法,基于通路的方法等,

2017龙星课程系列(二)_Java_04


MEMoMutual Exclusivity Modules)为例,这是一种基于生物学通路的网络分析识别driver mutation的方法。

首先,输入的突变基因的筛选。基因的突变显著高于背景突变率的基因。筛选拷贝数扩增与缺失的基因。拷贝数突变基因与基因表达谱相一致。

其次,基于人类参考网络,计算两个基因间的Jaccard系数,确定两个点的相似性。

2017龙星课程系列(二)_Java_05

随后,构建基因相似网络,提取网络中的cliques,

最后,通过马尔科夫蒙特卡洛置换模型,来评估每个模型。

2017龙星课程系列(二)_Java_06


最后得到mutual exclusivity modules(MEMo),模块中的基因在所有肿瘤样本中频繁改变,模块中的基因参与相同的生物学过程,基因之间的改变是互斥的。

2017龙星课程系列(二)_Java_07


最终识别到的模块中,模块中的基因处于同一生物学通路中,且呈现一种互斥模式,即当通路中一个基因改变,导致这个通路发生改变之后,其他的基因不倾向与发生突变。


1 癌症相关网络算法 


Networkrelated algorithms in cancer genomics 癌症相关网络的算法,DawnRank ,利用TCGA数据,发现癌症中的driver mutation

2017龙星课程系列(二)_Java_08


1 研究基因组改变的算法和瘤内异质性 


Algorithmsto study complex genomic alterations and intra-tumor heterogeneity研究基因组改变的算法和瘤内异质性,例如,通过基因组的异质性预测肿瘤的变化过程。通过单细胞测序,推测肿瘤的进化。

2017龙星课程系列(二)_Java_09


本文中的图片,均来自授课老师的讲课教材,感谢授课老师的精彩的课程安排与无私的分享。感谢哈工大的老师及工作人员在课程期间的精心准备与辛苦组织,提供了我们一个非常棒的学习机会。规格严格,功夫到家!!!