基因扰动(Genetic Perturbation)实验联合转录组测序技术(RNA-seq)可以系统评估基因扰动后下游通路和分子的变化,已经成为生命科学中基因功能研究的重要手段。目前已有大量基因扰动的数据发表,综合利用已有的扰动数据可以帮助探索基因在人类疾病中的调控规律, 但目前仍缺乏一个参考数据库,全面系统的覆盖人类已有的基因扰动数据集。
2022年11月26日,重庆医科大学附属第一医院乳腺甲状腺外科刘胜春课题组在Nucleic Acids Research(2022年IF19.16)杂志上以“GPSAdb: a comprehensive web resource for interactive exploration of genetic perturbation RNA-seq datasets”为题在线发表研究论文。该研究构建了目前最大的人类基因扰动转录组数据分析平台(https://www.gpsadb.com/, http://guotosky.vip:13838/GPSA/ )。
该平台系统收集、整理并分析了3048组涵盖13117个样本的基因扰动转录组数据,并且开发了一系列基于扰动数据的分析方法和可视化工具,包括Browse、Query、Mediator、enrichGPSA和GPSA。GPSAdb提供了对用户友好并且符合直觉的分析界面,使用起来十分便捷。Browse工具使得科研工作者可以轻松探索和分析当前的3048组RNA-seq数据。Query工具可以用于探索哪些基因扰动后会影响用户输入基因的表达。该平台还整合了课题组开发的衍生工具GPSA(Genetic Perturbation Similarity Analysis,基因扰动相似性度量), 用于计算转录组数据间扰动的相似性,用户只需要上传转录组的差异分析结果,GPSA就可以在既往的3048组RNA-seq计算出哪个基因敲减后的数据跟你的结果最像,从而帮助科研工作者确定药物处理、基因敲减,以及细胞状态改变中参与的重要分子和通路。当前GPSAdb的2.0版本已经在开发中,将会继续更新已有的Bulk RNA-seq数据,并且进一步整合基于CRISPR-screen和单细胞技术的扰动数据。
重庆医科大学附属第一医院乳腺甲状腺外科刘胜春教授、瓯江实验室主任宋伟宏院士为本文共同通讯作者,重庆医科大学博士后郭世朋为第一作者。该工作获得国家自然科学基金, 重庆市技术创新与应用发展专项重点项目以及重庆市博士后基金的支持。
刘胜春教授课题组长期专注基因的转录调控以及乳腺癌的发病机制研究,目前累计先后主持国家自然科学基金4项、省部级科研课题9项,长期从事乳腺癌特别是三阴性乳腺癌的基础与临床研究,发表中英文论文117篇,研究成果数次参与美国圣安东尼奥乳腺癌学术论坛交流。
4 篇 NAR | 生物大数据时代,如何做好数据管理和再利用,发IF10+的数据库文章?