欢迎关注”生信修炼手册”!
CANTATAdb数据库收录了植物中的lncRNA信息,主要通过l软件预测的方式识别植物中的lncRNA, 目前包含来自39个物种共239631个lncRNA,是目前最大的植物lncRNA数据库,网址如下
通过从NCBI的SRA和EBI的ENA数据库中收集植物的RNA_seq数据,通过比对组装得到转录本序列,然后通过CNCI软件来预测lncRNA。
通过导航栏的Search
菜单,可以从下拉列表中选择感兴趣的物种,查看对应的lncRNA信息,以水稻Oryza sativa
为例,检索框示意如下
可以通过CNCI
软件预测结果,肽段长度,表达量,外显子个数等参数对结果进行筛选。网页的第二部分展示的是筛选后的结果总数,示意如下
第三部分为最终结果,示意如下
在该数据库中,每个转录本ID以CNCT
开头,给出了染色体位置,CNCI软件的打分值,和swiss-prot蛋白数据库比对的结果,最大肽段长度,最大表达量,外显子个数等信息,点击Details
可以查看以下详细信息
1. Blast
2. 表达量
3. 肽段预测结果
4. 序列
该数据库中的lncRNA信息是可以免费下载的,提供了FASTA
和GTF
两种格式,示意如下
该数据库中收录的物种是最多的,做植物lncRNA研究的可以关注下这个数据库。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!