欢迎关注”生信修炼手册”!

有多项研究表明lncRNA与众多生物学过程,复杂疾病相关,为了进一步探究lncRNA在这些生命活动中的具体作用,我们需要对lncRNA的功能进行分析。

在生物信息学中,对于基因功能的挖掘,通常的做法就是利用GO和KEGG等功能数据库,但是这些数据库中都是蛋白编码基因的功能,为了利用这些数据库中的信息,我们需要在lncRNA与mRNA之间建立起联系,常见的思路有以下几种

  1. 通过lncRNA和mRNA之间的相互作用
    很多文献和数据库中都有报道的lncRNA与mRNA之间相互作用,也可以通过软件来预测二者之间的结合,通过lncRNA的靶标mRNA, 来研究lncRNA的功能。
  2. 通过lncRNA与mRNA的共表达
    通常认为共表达基因集参与同一通路,或者受到同样的调控,具有相似的生物学功能,利用表达谱数据寻找与lncRNA共表达的mRNA,从而来研究lncRNA的功能。
  3. 通过ceRNA调控机制
    ceRNA是近几年很火的一个概念,指的是各种RNA分子通过竞争性结合miRNA从而发挥调控作用,对于lncRNA而言,通过lncRNA-miRNA-mRNA这种ceRNA机制,将lncRNA关联到mRNA上来,从而去探究lncRNA的功能。

​Co-LncRNA​​通过分析查找与lncRNA共表达的mRNA,构建lncRNA与mRNA之间的共表达网络,并通过共表达的mRNA对应的GO和KEGG来研究lncRNA的功能,该数据库的网址如下

​http://bio-bigdata.hrbmu.edu.cn/Co-LncRNA/​

从GEO和TCGA中收集了来自28个组织/细胞系, 共6500个样本的RNA-seq数据,然后通过经典的 tophat+cufflinks+RSEM策略分别对mRNA和lncRNA进行定量,通过斯皮尔曼相关性分析和线性回归,分析lncRNA与mRNA之间的共表达,构建lncRNA与mRNA的共表达网络。对于lncRNA, 对其共表达的mRNA做GO和KEGG富集分析,采用的方法是费舍尔检验,将功能富集的结果当做该lncRNA的注释,完整流程示意如下

Co-LncRNA:lncRNA与蛋白编码基因的共表达网络数据库_数据库

​CEGs​​代表共表达基因Co-Expressed Genes,通过这个菜单可以浏览共表达分析的结果,示意如下

Co-LncRNA:lncRNA与蛋白编码基因的共表达网络数据库_数据库_02

选择数据集和共表达分析的方法,设置阈值,通过mRNA或者lncRNA的名字来查找对应的共表达基因,点击​​pattern​​可以查看详细的分析结果,示意如下

Co-LncRNA:lncRNA与蛋白编码基因的共表达网络数据库_数据库_03

通过​​CEGsFuncs​​查看lncRNA的共表达mRNA的功能富集结果,示意如下

Co-LncRNA:lncRNA与蛋白编码基因的共表达网络数据库_数据_04

对于KEGG富集的结果,点击可以查看具体的通路图,在通路图上,会将共表达的蛋白编码基因用红色标记,示意如下

Co-LncRNA:lncRNA与蛋白编码基因的共表达网络数据库_生物信息学_05

通过​​CEGsNet​​, 可以查看lncRNA与mRNA的共表达网络,示意如下

Co-LncRNA:lncRNA与蛋白编码基因的共表达网络数据库_数据库_06

该网站还支持上传自己的lncRNA和mRNA表达谱,然后进行共表达分析,界面示意如下

Co-LncRNA:lncRNA与蛋白编码基因的共表达网络数据库_生物信息学_07

该数据库中的数据是免费下载的,通过该数据库,我们不仅可以查找已有的lncRNA与mRNA的共表达分析结果,还可以对自己的数据进行共表达分析。

·end·

—如果喜欢,快分享给你的朋友们吧—


扫描关注微信号,更多精彩内容等着你!

Co-LncRNA:lncRNA与蛋白编码基因的共表达网络数据库_生物信息学_08