欢迎关注”生信修炼手册”!

CANTATAdb数据库收录了植物中的lncRNA信息,主要通过l软件预测的方式识别植物中的lncRNA, 目前包含来自39个物种共239631个lncRNA,是目前最大的植物lncRNA数据库,网址如下

​http://yeti.amu.edu.pl/CANTATA/​

通过从NCBI的SRA和EBI的ENA数据库中收集植物的RNA_seq数据,通过比对组装得到转录本序列,然后通过CNCI软件来预测lncRNA。

通过导航栏的​​Search​​​菜单,可以从下拉列表中选择感兴趣的物种,查看对应的lncRNA信息,以水稻​​Oryza sativa​​为例,检索框示意如下

CANTATAdb:植物lncRNA数据库_数据库

可以通过​​CNCI​​软件预测结果,肽段长度,表达量,外显子个数等参数对结果进行筛选。网页的第二部分展示的是筛选后的结果总数,示意如下

CANTATAdb:植物lncRNA数据库_数据库_02

第三部分为最终结果,示意如下

CANTATAdb:植物lncRNA数据库_数据库_03

在该数据库中,每个转录本ID以​​CNCT​​​开头,给出了染色体位置,CNCI软件的打分值,和swiss-prot蛋白数据库比对的结果,最大肽段长度,最大表达量,外显子个数等信息,点击​​Details​​可以查看以下详细信息

1. Blast

CANTATAdb:植物lncRNA数据库_数据_04

2.  表达量

CANTATAdb:植物lncRNA数据库_段长度_05

3. 肽段预测结果

CANTATAdb:植物lncRNA数据库_数据_06

4.  序列

CANTATAdb:植物lncRNA数据库_数据_07

该数据库中的lncRNA信息是可以免费下载的,提供了​​FASTA​​​和​​GTF​​两种格式,示意如下

CANTATAdb:植物lncRNA数据库_数据_08

该数据库中收录的物种是最多的,做植物lncRNA研究的可以关注下这个数据库。

·end·

—如果喜欢,快分享给你的朋友们吧—


扫描关注微信号,更多精彩内容等着你!

CANTATAdb:植物lncRNA数据库_数据_09