欢迎关注”生信修炼手册”!
癌症作为人类健康的头号杀手,其研究的意义不言而喻。目前世界范围内已经有大量的肿瘤相关数据,鉴于公共数据库的数据挖掘成为一种趋势。
GEO是一个国际化的开源项目,允许研究者提交自己的数据到该数据库,在世界范围内公开共享自己的数据;TCGA是一个大型癌症研究项目,通过收集整理癌症相关的各种组学数据,提供了一个大型的,免费的癌症研究参考数据库。
目前基于公共数据库进行数据挖掘的文献越来越多,本文整理了TCGA, GEO等公共数据库的相关资料。
首先是GEO数据库
接下来是TCGA
- TCGA数据库简介
- 使用GDC在线查看TCGA数据
- 使用gdc-client批量下载TCGA数据
- 一文搞懂TCGA中的分析结果如何来
- 通过GDC Legacy Archive下载TCGA原始数据
- 使用GDC API查看和下载TCGA的数据
- 使用GDC下载TCGA肿瘤患者的临床信息
- 使用TCGAbiolinks下载TCGA的数据
- 使用TCGAbiolinks进行生存分析
- 使用TCGAbiolinks分析TCGA中的表达谱数据
- 使用TCGAbiolinks进行甲基化和转录组数据的联合分析
- UCSC Xena:癌症基因组学数据分析平台
- TANRIC:肿瘤相关lncRNA数据库
- SurvNet:基于网络的肿瘤biomarker基因查找算法
- TCPA:肿瘤RPPA蛋白芯片数据中心
- TCGA Copy Number Portal:肿瘤拷贝数变异数据中心
- Broad GDAC:TCGA数据分析中心
- 使用cBioPortal查看TCGA肿瘤数据
TCGA中存储的是各种肿瘤的多组学数据和样本临床信息,除了多组学的联合分析和深入挖掘外,还可以结合样本临床信息进行生存分析
除了TCGA外,肿瘤相关的数据库还有很多
- ICGC:国际肿瘤基因组协会简介
- CCLE:肿瘤细胞系百科全书
- GEPIA:TCGA和GTEx表达谱数据分析平台
- HPA:人类蛋白图谱数据库
- DisGeNet:疾病相关的基因与突变位点数据库
- Disease Ontology:人类疾病分类数据库
- Oncomine:肿瘤芯片数据库
- ONGene:基于文献检索的肿瘤基因数据库
- oncomirdb:肿瘤相关的miRNA数据库
- TSGene:肿瘤抑癌基因数据库
- NCG:肿瘤驱动基因数据库
- mutagene:肿瘤突变频谱数据库
对于肿瘤组织中浸润的免疫细胞进行研究,也是一个热点
- Cancer-Immunity Cycle:肿瘤免疫循环简介
- TMB:肿瘤突变负荷简介
- 肿瘤微环境:Tumor microenvironment (TME)简介
- 肿瘤浸润免疫细胞量化分析简介
- 使用EPIC预测肿瘤微环境中免疫细胞构成
- TIMER:肿瘤浸润免疫细胞分析的综合网站
- quanTIseq:肿瘤浸润免疫细胞定量分析
以TCGA为代表的肿瘤数据挖掘涉及了各种公共数据库的交叉使用,多组学的联合分析,需要扎实的理论基础和较强的生信分析能力。本公众号对外提供多种组学的数据分析服务,有需求的小伙伴欢迎后台私信,期待与大家的合作。
·end·