前言


GEO在线工具:GEO2R


提示:以下是本篇文章正文内容,下面案例可供参考

一、GEO2R是什么?

是GEO在线分析工具,基于此工具可以对部分GEO样品数据进行基因差异表达分析。该工具主要针对芯片数据,借助R 及Limma包完成分析过程,用户只需要在网业上进行简单的点击等手动操作即可获得分析结果

二、使用步骤

1.对样本数据的搜索,这一过程在单细胞中已经讲过,我们就跳过了

如果有不知道的,可以去单细胞的数据下载中去查看

2.使用GEO2R

代开你所需要的GSE侯是这样的,

自动数据挖掘 数据挖掘在线_数据集

 

滑到最下面则是这样的

自动数据挖掘 数据挖掘在线_数据_02

看到下面的那个蓝色的按钮了吗?就点他就好

 

自动数据挖掘 数据挖掘在线_自动数据挖掘_03

点开之后这是对每个样本的一些介绍,并且明确分开了两个组的内容,要做差异分析必须要分组,所以按 一下上方的DEfine groups 

自动数据挖掘 数据挖掘在线_自动数据挖掘_04

就会出现这样的一个小框,大家输入normal然后点回车在输入tumor,然后按住ctrl键将对应的样本放入分组中,然后往下拉有一个按钮,按下去就会将前250个最有显著意义的基因筛选出来,

自动数据挖掘 数据挖掘在线_生物信息学_05

排列顺序是按照p值排序的,为什么按照p值排序大家可以去看我之前的文章。 

 

然后大家看左边每个ID旁边都有一个小三角,按一下之后就会出现这个

 

自动数据挖掘 数据挖掘在线_生物信息学_06

 看一看到每个样本每个组之间的表达情况,logFC的值就是表达高的一方与表达低的一方的比值,以2为底。

大家再点这个按钮

 就可以得出样本之间的数据

自动数据挖掘 数据挖掘在线_生物信息学_07

 

自动数据挖掘 数据挖掘在线_生物信息学_08

是这样的 ,但是这样的数据我们没法用在后续的分析,所以我们需要处理,选择你要使用的数据,打开excel将数据复制进一个表格中,是这样的

 

自动数据挖掘 数据挖掘在线_数据_09

 

然后选中第一列 ,然后在数据一栏中选择分列

自动数据挖掘 数据挖掘在线_数据集_10

 

 然后选择固定宽度,根据实际需求选择分组

自动数据挖掘 数据挖掘在线_数据集_11

  

分开之后,但是发现数据有一堆分号,所以我们是用替换功能将分号替换为空格就好了,然后自己手动修改表头列名就好

然后大家做可视化的时候可以在这完成,大家看下图各种各样的可视化的图都有,

自动数据挖掘 数据挖掘在线_数据集_12

可以根据自己的实际需要使用可视化图 

 适用范围:

点击这个Full instructions就会出现适用范围

自动数据挖掘 数据挖掘在线_数据集_13

 

大致范围是:GEO2R是一种交互式网络工具,允许用户比较 GEO 系列中的两组或更多组样本,以识别在不同实验条件下差异表达的基因。结果显示为按显着性排序的基因表和图形集合,以帮助可视化差异表达的基因并评估数据集质量。与 GEO 的其他数据集分析工具不同,GEO2R 不依赖于策划的数据集,而是直接查询原始系列矩阵数据文件。这允许及时分析更大比例的 GEO 数据。然而,重要的是要意识到该工具几乎可以访问和分析任何 GEO 系列,无论数据类型和质量如何,因此用户必须了解 GEO2R限制和注意事项


总结

本章主要是讲解了GEO的在线工具,如果只是自己用于实验的话,这个在线工具能解决很多需求,它的可视化方便了很多非生信的使用者。