前言
龙星课程在哈尔滨工业大学的航天馆正如火如荼的进行着:
本次龙星课程主要讲的是癌症基因组分析中的算法,主要从4个方面进行阐释。
Background of cancer biologyand cancer genomics 癌症基因组与癌症生物学的背景
Algorithms to study inter-tumorheterogeneity 瘤间的异质性的算法
Network related algorithms incancer genomics 癌症相关网络的算法
Algorithms to study complexgenomic alterations and intra-tumorheterogeneity研究基因组改变的算法和瘤内异质性
1 癌症基因组
首先,在此简单介绍一下癌症基因组。
癌症基因组概览:染色体内的重排,染色质间的重拍,点突变,拷贝数的改变。
一些重要基因的改变会驱使细胞生长,呈现一种癌症的表型。
这些基因包括:
1、原癌基因:当发生突变或者高表达的时候,导致正常细胞向肿瘤细胞转变。
2、肿瘤抑制基因:一类,可以抑制正常细胞生长的基因
3、修复基因:可以修复DNA的损伤或者错误。
正常组织中,原癌基因与肿瘤抑制基因相辅相成,共同调控细胞生长。但在癌症中,原癌基因突变使其活性增强,肿瘤抑制基因的突变或失去,导致功能丧失,细胞生长失调,导致恶性肿瘤。
1 肿瘤间异质性
以研究肿瘤间异质性的算法为例简单介绍一下,肿瘤异质性一直是癌症基因组分析中的一个热点与关键,以下是几种常用的方法。
1、聚类:可以发现成簇的基因或者样本分组
对于基因表达谱数据,聚类可以通过相似的基因表达,得到功能相关的基因通过表达相似,可以预测未知基因的功能;通过表达相似,可以基因可能调控的其他基因。样本聚成一簇,说明样本有着相似的临床特征。常用的聚类算法,有层次聚类,K均值聚类
2、而Somatic mutation也是肿瘤异质性的一个重要原因,SV既可以作为driver mutation 也可以作为passenger mutation。
检测driver mutation 方法,分为以下几种:有基于序列的方法,机器学习的方法,基于通路的方法等,
以MEMo(Mutual Exclusivity Modules)为例,这是一种基于生物学通路的网络分析识别driver mutation的方法。
首先,输入的突变基因的筛选。基因的突变显著高于背景突变率的基因。筛选拷贝数扩增与缺失的基因。拷贝数突变基因与基因表达谱相一致。
其次,基于人类参考网络,计算两个基因间的Jaccard系数,确定两个点的相似性。
随后,构建基因相似网络,提取网络中的cliques,
最后,通过马尔科夫蒙特卡洛置换模型,来评估每个模型。
最后得到mutual exclusivity modules(MEMo),模块中的基因在所有肿瘤样本中频繁改变,模块中的基因参与相同的生物学过程,基因之间的改变是互斥的。
最终识别到的模块中,模块中的基因处于同一生物学通路中,且呈现一种互斥模式,即当通路中一个基因改变,导致这个通路发生改变之后,其他的基因不倾向与发生突变。
1 癌症相关网络算法
Networkrelated algorithms in cancer genomics 癌症相关网络的算法,DawnRank ,利用TCGA数据,发现癌症中的driver mutation
1 研究基因组改变的算法和瘤内异质性
Algorithmsto study complex genomic alterations and intra-tumor heterogeneity研究基因组改变的算法和瘤内异质性,例如,通过基因组的异质性预测肿瘤的变化过程。通过单细胞测序,推测肿瘤的进化。
本文中的图片,均来自授课老师的讲课教材,感谢授课老师的精彩的课程安排与无私的分享。感谢哈工大的老师及工作人员在课程期间的精心准备与辛苦组织,提供了我们一个非常棒的学习机会。规格严格,功夫到家!!!