官方认定的不编程差异分析工具。



众所周知,如何在浩如烟海的分子中做出取舍,并真正确定分子主变量,是科研启航至关重要的一步。而酸菜老师的筛猜二字决,就是基本敲定一个候选分子的不二法宝。 芯片作为高通量数据筛选的最常见技术平台之一可提供成千上万的基因表达量变化。鉴于这上万的基因不一定都参与疾病的发生,因而从芯片数据中找寻候选分子,就要进行差异基因表达分析。 《生信体系课-上篇》段位一的知识模块02将针对此问题进行具体的阐述,其中的第一节课先是简要介绍了芯片标准分析流程,其次第二节课则讲解了GEO数据库在线工具GEO2R的具体使用方法。

01


在第一课《芯片标准分析流程》中,R语言是生信分析的基础,在线数据库差异分析也大多基于R语言Limma包,因此本模块第一节课则简单介绍了基于R语言的芯片标准分析流程,包括相关准备工作的完成、数据的预处理、差异基因分析和可视化。

R语言差异基因umap降维 geo差异表达分析r语言_数据库

R语言差异基因umap降维 geo差异表达分析r语言_R语言差异基因umap降维_02

R语言差异基因umap降维 geo差异表达分析r语言_R语言差异基因umap降维_03

随后,课程中也比较了芯片在线分析流程与R语言分析流程的异同。



R语言差异基因umap降维 geo差异表达分析r语言_数据库_04

其次,课程简要介绍了3个芯片分析数据库:NetworkAnalyst、GEO和GCBI数据库,学员们在了解这三个数据库的优缺点后,根据自己的科研需求选择合适的数据库进行芯片数据分析。



R语言差异基因umap降维 geo差异表达分析r语言_数据库_05

R语言差异基因umap降维 geo差异表达分析r语言_数据库_06

R语言差异基因umap降维 geo差异表达分析r语言_数据库_07

02

GEO2R是GEO数据库提供的在线工具,主要用于比较2组或多组样本,以获得差异性表达的基因。

GEO 2R主要是对系列数据(series)进行分析,但不是所有系列数据都能用GEO2R工具进行分析,比如测序数据就不能使用GEO2R,对于这类数据,工具栏中的“Analyze with GEO2R”按钮不会显示。


课程以肺癌相关基因表达谱为例,具体讲解了基因表达数据库GEO的分析工具GEO2R的具体使用方法以及数据解读。 1.GEO2R操作方法


R语言差异基因umap降维 geo差异表达分析r语言_数据_08

R语言差异基因umap降维 geo差异表达分析r语言_分析工具_09

R语言差异基因umap降维 geo差异表达分析r语言_数据_10

R语言差异基因umap降维 geo差异表达分析r语言_分析工具_11

2.GEO2R数据解读

R语言差异基因umap降维 geo差异表达分析r语言_分析工具_12

R语言差异基因umap降维 geo差异表达分析r语言_数据库_13

R语言差异基因umap降维 geo差异表达分析r语言_R语言差异基因umap降维_14

另外,课程也通过实例操作演示GEO2R工具的具体流程,同时也介绍了如何利用GEO2R获取变化幅度大且有统计学意义的基因群、以及多组间差异分析的具体过程。 学员们可快速学会两组或多组样本的差异表达分析,以及表达图谱的可视化显现。


R语言差异基因umap降维 geo差异表达分析r语言_R语言差异基因umap降维_15

R语言差异基因umap降维 geo差异表达分析r语言_R语言差异基因umap降维_16

R语言差异基因umap降维 geo差异表达分析r语言_分析工具_17