2022年2月26日,南方科技大学生物系植物与食品研究所翟继先课题组发布了可以方便快速查询~45,000个植物公共RNA-seq文库的在线资源(PPRD, http://ipf.sustech.edu.cn/pub/plantrna/),相关成果以“PPRD: a comprehensive online database for expression analysis of ~45,000 plant public RNA-Seq libraries” 为题发表在国际知名学术期刊《Plant Biotechnology Journal》。

近十年间,随着测序成本的降低和数据质量的提高,RNA-seq已经成为研究基因表达常用手段。截至2021年,对于主要作物,如玉米、水稻、大豆、小麦和棉花,公共数据中RNA-seq的文库数量以指数速度已增加到~45,000个。目前已有一些相关的数据库,但现存的数据库通常对不同的实验项目产生的数据分别进行定量处理,使用不同的分析流程和不同版本的基因组和注释文件,所以难以直接比较它们之间的表达水平。为了解决这一挑战,充分利用公共RNA-seq文库,迫切需要通过统一的处理流程分析所有公开可用的文库数据,并将它们整合到一个易于使用的数据库中。

翟继先课题组此次发布的数据库(Plant Public RNA-seq Database, PPRD)整合了来自GEO、SRA、ENA和DDBJ数据库中几乎所有的玉米(19,664)、水稻(11,726)、大豆(4,085)、小麦(5,816)和棉花(3,483)的RNA-seq文库资源。该工作对所有的文库信息进行整理和分类,得到大量的突变体、处理条件以及不同组织和生长发育时期的文库,除了对所有文库进行标准分析之外,同时对含有生物学重复的860组突变体文库和2,575组处理相关的文库进行了基因差异表达分析。

为了提高数据库使用的效率,PPRD支持基因名、文库名、项目编号、关键字、以及任意两种进行组合的查询,并以多种形式的表格或者图片返回查询结果,包括不同组织、不同发育时期、不同非生物胁迫和生物胁迫下的基因表达模式,以及基因在不同突变体和胁迫条件下的差异表达情况。PPRD支持基因共表达结果的查询,同源基因表达量查询。此外,PPRD内嵌基因组浏览器,支持用户查看基因组局部比对情况。为便于研究者之间快捷地分享最新搜索结果,PPRD提供了网页共享功能,并定期更新文库资源,研究者可通过共享按钮来共享当前结果。

实用!45000个植物公共RNA-seq文库的在线搜索平台公布_大数据

PPRD数据库概况

A:水稻、玉米、大豆、小麦和棉花在2010年-2020年间的测序数据增长情况;B:PPRD文库统计信息;C-E:组织特异表达基因的验证;F:基因OsLecRK3在不同生物胁迫条件下的表达水平;G:基因OsLecRK3在不同处理条件下的下调表达情况;H:基因OsLecRK3在对照和干旱文库中的基因组局部比对情况。

课题组博士研究生于义溟,硕士研究生张洪为共同第一作者,翟继先副教授为该论文的通讯作者。生物系龙艳萍研究助理和博士研究生束艺,也参与了本研究的部分工作。该研究得到了广东省创新创业团队等项目的资助。

原文链接:

https://onlinelibrary.wiley.com/doi/10.1111/pbi.13798


实用!45000个植物公共RNA-seq文库的在线搜索平台公布_大数据_02