接触生物信息有段日子了,自己也发表了几篇数据挖掘的文章,感觉数据挖掘很大程度上来说是在做两件事:1.比较(异同) 2.富集(特征)。举个例子来说,如果我们对control-treatment做差异表达分析,算法会给出的差异表达基因list,按照某个统计量,比如fold change,也就是control相较于treatment的变化倍数,从小到大排序,得到一个rank list,怎么从这个list
GSVA的简介 Gene Set Variation Analysis,被称为基因集变异分析,是一种非参数的无监督分析方法,主要用来评估芯片核转录组的基因集富集结果。主要是通过将基因在不同样品间的表达量矩阵转化成基因集在样品间的表达量矩阵,从而来评估不同的代谢通路在不同样品间是否富集。其实就是研究这些感兴趣的基因集在不同样品间的差异,或者寻找比较重要的基因集,作为一种分析方法,主要是是为了从生物信
转载 4月前
55阅读
富集分析是生物医学论文中非常常见的一类分析,例如GO富集分析,Pathway富集分析等。其结果一般包括以下几个要素:1,名字(GO term或者KEGG description);2,该名字中包含的基因;3,该名字中包含的基因的P值等。常见的绘图包括:气泡图,条形图。今天我们利用GOplot R包,来绘制一个弦图(chord plot)。弦图简介:下面这个圆形的、错综复杂的图就是弦图,属于圈图的一
01—什么是P-VALUE?请用自己的语言简要概括,并举一例子在假设原假设(H0)正确时,出现现状或更差的情况的概率。在生物信息学差异分析的表达图中,p-VALUE代表的是显著差异,p值越小,代表这个基因的表达越显著,举例:H0:硬币均匀,正反出现概率各为1/2。这次实验我们抛10次硬币,发现有8次反面,那么在这里面出现的现状和更差的情况是8,9,10,0,1,2    &nb
在前面两篇文章中,笔者已经介绍了两种聚类算法,同时还通过sklearn完成相应的示例。但是,到目前为止笔者还没有介绍如何来聚类的经过进行评估。这接下来的这篇文章中,笔者将会介绍在聚类算法中几种常见的评估指标,以及其中两种相应的原理。同时,如果不用关系其具体计算过程的,可以直接阅读第三部分即可。如同之前介绍的其它算法模型一样,对于聚类来讲我们同样会通过一些评价指标来衡量聚类算法的优与劣
  GO的主要用途之一是对基因组进行富集分析。例如,给定一组在特定条件下上调的基因,富集分析将使用该基因组的注释发现哪些GO术语被过度表示(或未充分表示)。  富集分析工具                  用户可以直接从GOC网站的主页进行浓缩分析
1. 简介 GSEA 是 2003 年提出来的一种对表达谱芯片进行分析的方法,并被编制成软件。它的主要目的就是确定预先定义的基 因集(具有相同或相似的功能,或位于同一染色体相邻位点的一群基因)在表达谱芯片结果中是否有显著性。 GSEA 分析过程分为 5 步: 1. 基因知识库的获得; 2. 根据基因表达谱数据对所有基因进行排序; 3. 计算富集得分(enrichment score,ES); 4.
转载 2024-05-25 22:07:48
958阅读
GSEA分析一、GSEA介绍二、GSEA原理2.1 数据矩阵文件2.2 GSEA计算中几个关键概念1. Ranked Gene List L的排序算法2. 计算富集得分 (ES, enrichment score).3. 评估富集得分(ES)的显著性。4. ES标准化5. 多重假设检验校正(q-value)。6. RANK7. Leading-edge subset8. LEADING EDGE
TPM 1.2规范主要面向PC平台,其103版本在2009年被接受为ISO标准(ISO/IEC 11889),而且国际上上亿的终端机器和laptop都配备了TPM安全芯片,到目前为止,虽然有声称TPM 2.0的芯片制造出来,不过占据主要市场的还是TPM 1.2芯片。由于TPM 2.0与TPM 1.2芯片并不兼容,在上层软件链成熟前,基于TPM 1.2的芯片还会持续一段时间。不过,由于TPM
Go和KEGG富集教程前提操作步骤注释中心库 前提假设现在你已经在R官网上下载并安装好了R,并且已经有了自己的基因数据,例如一个excel表格中存放的数据。如下面这种形式。 现在需要做GO富集和KEGG的富集并生成想要的气泡或者通路图。操作步骤安装clusterProfilerif (!requireNamespace("BiocManager", quietly = TRUE)) in
Mysql中的count()与sum()区别 首先创建个表说明问题CREATE TABLE `result` (  `nam
原创 2022-08-18 16:59:42
133阅读
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。2021年9月6日,华中农业大学周道绣教授课题组以“DNA demethylases remodel DNA methylation in rice gametes and zygote and are required for reproduction”为题在《Molecular Plant》期刊发表研究论文,该研究利用单细胞DNA甲
应用 背景  E-GEOS提供了第一次评估的洪水所造成的损失,已经达到威尼托大区在过去的几年里,尤其是周边地区维琴察,帕多瓦和Bovolenta地图。  快速的地图服务提供商,成为地中海地区的安全(应急响应的服务和应用程序)项目的一部分,意大利公司在他们的帮助下已经确定了洪水泛滥的程度,并生成详细的地图,利用卫星数据,意大利COSMO-卫星星座的星座。意大利
segmatch是一个提供车辆的回环检测的技术,使用提取和匹配分割的三维激光点云技术。分割的例子可以在下面的图片中看到。该技术是基于在车辆附近提取片段(例如车辆、树木和建筑物的部分),并将这些片段与从目标地图中提取的片段相匹配。分段匹配可以直接转化为精确的定位信息,从而实现精确的三维地图构造和定位。在先前记录的部分(白色)和最近观察到的部分(彩色)之间,匹配的段的实例绿色线显示在下面的图像中。该
目录9 启动9.1 介绍9.2 _TPM_Init9.3 TPM启动事件相关源码 9 启动启动在这里被定义为每次系统启动时需要做的软件操作。系统启动可以是冷启动,或者是PC相关的从睡眠中唤醒,或者从休眠中重新启动。TPM内部有几种易失性的状态,包括PCR值,已加载的会话和密钥,使能配置,授权和Policy信息,混合NV索引,以及时钟状态。根据TPM电源周期类型的不同,这些易失性状态可能必须被保留
转载 2024-05-30 10:53:56
86阅读
 一、前言APM又称应用性能统计,主要用来跟踪请求调用链,每个环节调用耗时,为我们诊断系统性能、定位系统问题提供了极大便利。本系统采用的是Elastic Stack体系中的APM,主要是之前部门搞PCI认证,其中有一环ELK,而刚好ELK就是我搭建的,这里就顺便使用ELK体系的APM,没必要再另起一套了。二、实现首先,你需要搭建好ELK平台,这里搭建过程不做赘述,大家参考Elastic
基因列表的分析一般都会涉及GO和KEGG分析,Bioconductor提供了很多这方面的R工具包。选择工作目录,读入上一次分析和保存的数据: results.sig <- read.csv("results.lim.7d.csv", header=TRUE, as.is=TRUE) head(results.sig) ## X logFC AveExpr
众所周知,数据是当今 IT 领域的一切。此外,这些数据每天都在大量增长。早些时候,我们常谈论千字节和兆字节。但是现在,我们谈论的是TB、PB。单纯的数据是没有意义的,直到它变成有用的信息和知识,进而帮助管理层进行决策。为此,我们在市场上调查了一些常用的大数据软件。这些软件可用于完成对数据进行存储、分析、报告等工作。15款使用最多的大数据分析工具    下面介
这期推文的封面是一张富集分析的网络图,来自文献:Single cell RNA sequencing of human liver reveals distinct intrahepatic macrophage populations,算是比较新颖的富集展示方法,是Cytoscape做的。之前我介绍过一个网页工具,可以做富集结果的网络图,这篇推文的阅读量已经是我的小破公众号关注人数的两倍多,可
转载 2021-04-02 11:16:40
1181阅读
1点赞
2评论
DAVID提供的基因富集功能,主要是GO和KEGG分析:GO(Gene Ontology GO)分析:对上传的基因列表进行富集,从而找到和下面三类term相关的基因群:细胞组分(Cellular Component BP):描述基因产物在细胞中的位置,例如内质网、细胞核、蛋白酶体分子功能(Molecular Function MF):基因产物的功能,如酶的结合活性或催化活性生物学过程(Biolog
  • 1
  • 2
  • 3
  • 4
  • 5