假设我们想搜具有某种功能的一类基因,比如具有激酶活性的基因,我们应给怎么办呢?gene ontology(http://www.geneontology.org/),可以大致翻译为基因注释数据库就可以帮上忙了。个人理解对于本体(ontology)的解释就是最终认识,即对于以前的不明了和不方便的基因注释来联系起来,最终让生物学家方便的搞科研。下面摘抄了在生物统计学家园网站上的三个帖子
转载 2024-07-10 19:06:48
122阅读
本地BLAST的使用 数据库的获取 最简单的方法是直接到NCBI或别的网站去下载 也可以将自己的序列,或与自己工作相关的序列进行整理构建成一个小型的数据库 注意:以上文件格式一般可存为fasta格式 构建BLAST用的数据库 将已构建好的数据拷贝到你所设定的数据库所在文件夹 运行cmd命令 在cmd环境中输入如下所示命令 formatdb –i inseqs.fa –p F –o T –n db_
 大佬的记录EasyEnsemble:一种简单的不平衡数据的建模方法(附测试代码)桔了个仔旅居新加坡/AI风控/数据科学/FinTech/码农102 人赞同了该文章摘要虽然我这里洋洋洒洒写了2000字,但实际原理我一句话就能讲完,那就是”通过重复组合正样本与随机抽样的同样数量的负样本,训练若干数量分类器进行集成学习“。但为了让大家对这个算法有深入的了解,还是写一篇详细的文章,顺便跑个数据
基因融合指的是两个或者多个基因的部分序列结合到一起形成了一种新的基因。随着高通量测序的发展,我们可以利用二代测序的数据来鉴定出发生在不同疾病当中的融合基因,所以也就出现了很多来寻找融合基因数据库。今天就来给大家介绍几个融合基因查询的数据库。 TumorFusions(https://www.tumorfusions.org/)提到高通量测序的数据,肯定是绕不开TCGA的数据库。那么庞大的测序量
今天来说说单细胞转录组数据的细胞轨迹分析,学会这些分析结果,距离发文章就只差样本的选择了,有创新性的样本将成为文章的亮点,并不是分析内容了!这期继续介绍 Monocle 3 软件包用于研究细胞拟时性分析也就是细胞的生长发育轨迹分析。前 言单细胞转录组测序(scRNA-seq)实验使我们能够发现新的细胞类型,并帮助我们了解它们是如何在发育过程中产生的。Monocle 3包提供了一个分析单细胞基因表达
1.基本GFF和GTF是两种最常用的数据库注释格式,基因注释文件。GFF全称为general feature format,这种格式主要是用来注释基因组。GTF全称为gene transfer format,主要是用来对基因进行注释,对染色体上的基因进行标注。//我这里关注的主要是GTF文件。2.格式以tab键分割为9列:seq_id:染色质名称;source:注释团队;type: 注释信息的类型
转载 2024-04-22 10:05:09
665阅读
Ensemble IDEnsemble ID 是Ensembl 数据库使用的ID标识符,用于标识不同的分子特征,如基因,转录本,外显子,蛋白。大多数据库都有一套自己的ID命名。ID 主要是为消除歧义,在特征注释数据库更新时也能保持一致。不像人为命名的分子名字,如基因名字那样可能发生改变。就类似于我们的身份证号, 名字方便于平常的交流使用,ID是独一无二的。ID 格式Ensemble ID 个格式
转载 2024-05-06 17:53:01
2061阅读
maker 在基因注释上,MAKER算是一个很强大的分析流程。能够识别重复序列,将EST和蛋白序列比对到基因组,进行从头预测,并在最后整合这三个结果保证结果的可靠性。此外,MAKER还可以不断训练,最初的输出结果可以继续用作输入训练基因预测的算法,从而获取更高质量的基因模型。Maker的使用比较简单,在软件安装成后,会有一个"data"文件
题目:Improving Silkworm Genome Annotation Using a Proteogenomics Approach期刊:Journal of Proteome Research发表时间:June 28, 2019DOI:10.1021/acs.jproteome.8b00965分享人:张霞 内容与观点:1、 文章研究概述桑蚕是一种重要的经济昆虫,并作为鳞翅目模
转载 9月前
36阅读
相信,基因信息检索涉及到我们每个科研实验人员每天的日常实验中,而用的多的几个数据库莫过于NCBI RefSeq,Ensemble,mirBase三个数据库。那这三个数据库基因信息都是根据什么规则来命名的呢?一、NCBI RefSeqNCBI RefSeq(美国国立生物技术信息中心参考序列)是目前世界上最具有权威性的序列数据库,该数据库中所有的数据是一个非冗余的、提供参考标准的数据,包括染色体、
转载 2024-06-28 06:18:35
771阅读
从上面几篇的决策树開始,就能够開始进入到集成学习(ensemble learning)了,与其说集成学习是一种算法,倒不如说集成学习是一种思想. 集成学习的思想也是非常自然非常符合人类直观理解的. 用通俗的不能更通俗的话来说,要是一个机器学习器解决不了问题,那就多训练几个.再把这些学习器结合起来完毕机器学习任务. 能够类比开会,一群人讨论得到的解决的方法一般比一个人拍板的要好. 用过集成学习之
Yang, H., Bell, T., Churchill, G. et al. On the subspecific origin of the laboratory mouse. Nat Genet 39, 1100–1107 (2007). https://doi.org/10.1038/ng2087Supplementary Text and Figures这篇2007年发表在NG上的文章
理由:①.Biomart里面Ensemble Regulation数据着实太少!人类转录因子结合位点数据相对而言多一点,而小鼠的转录因子数据,真的少得可怜。可能是因为经过验证过的数据才能放上来吧(纯属个人猜测)。不过组蛋白修饰结合位点数据很多,对于有需要的人而言,我觉得该方法这是不错的选择。           ②.想下载全部转录因子结合
转载 2024-04-19 15:56:35
1491阅读
数据分析中,经常需要下载物种的参考基因组序列。通常情况下,可以考虑以下3个数据库NCBIEnsemblUCSC这三个数据库都是公共的大型数据库,里面存储了很多物种的基因组序列。这3个数据库作为第一选择,如果这三个数据库中都没有你要寻找的物种,可以尝试寻找该物种特有的数据库。同一个基因组在以上三大数据库中的记录还是稍有不同的,以human为例,在NCBI中的链接如下https://www.ncbi
摘要:HiEngine与华为GaussDB (for MySQL)集成,将内存数据库引擎的优势带到云端,并与基于磁盘的引擎共存。HiEngine的性能比传统的以存储为中心的解决方案高出7.5倍。作者:云数据库创新Lab 。导读华为云数据库创新Lab在一作论文《HiEngine: How to Architect a Cloud-Native Memory-Optimized Database En
问题描述:想要对一批文献做分析,筛选出对自己有帮助的文献。作用:EndNote可以方便地进行文献检索,提高文献阅读效率,省去了逐篇下载阅读文献的步骤。使用方法:打开EndNote,新建的作用是集中所需查阅的整类文献,比如“治疗”主题的、“恢复”主题的等。新建好之后本地会生成一个.enl文件和一个.Data文件,只要把这两个文件做好备份,以后重装EndNote时就可以一键还原文献。新建分组,
在2018年8月举行的亚运会女子50米仰泳比赛中,中国队的刘湘以26秒98的成绩打破世界女子50米仰泳尘封9年的世界纪录,在赛场上刮起了中国旋风。一年之后的2019年10月2日,在另一个特殊的赛场上,中国人又破了一项尘封9年的世界纪录——全球数据库领域最权威的国际事务处理性能委员会(TPC)在其官网上宣布,阿里巴巴/蚂蚁金服的分布式关系数据库OceanBase打破数据库基准性能测试(TPC-C)的
# 如何使用MySQL访问Ensembl数据库 在生物信息学领域,Ensembl是一个重要的基因组和注释数据库,许多科研人员依赖它来获取基因数据。本篇文章将指导你如何通过MySQL连接和查询Ensembl数据库。以下是实现的总体流程。 ## 1. 流程概述 以下是连接和使用Ensembl MySQL数据库的步骤概述: ```mermaid flowchart TD A[下载和安装
原创 9月前
150阅读
第1章 Amazon Neptune 技术概述1.1 什么是图数据库Amazon Neptune 是一项快速、可靠且完全托管的图数据库服务,可帮助您轻松 构建和运行使用高度互连数据集的应用程序。Amazon Neptune 的核心是专门构建的高 性能图数据库引擎,它进行了优化以存储数十亿个关系并将图形查询延迟降低到毫秒 级。 Amazon Neptune 支持常见的图形模型 Property Gr
实验一 基因组组装一、实验目的熟悉基因组从头组装原理及步骤掌握velvet, minia, SPAdes等短序列拼装软件使用熟悉用quast评价组装效果二、基因组组装组装原理与方法两种策略Overlap/layout/consensusDe Bruijn k-mer graphs第一种策略主要应用在长reads组装上,如sanger测序数据和第三代测序数据,组装软件包括phrap, cap3等。
转载 11月前
103阅读
  • 1
  • 2
  • 3
  • 4
  • 5