最近搜集整理单细胞研究的时候,看到于2015年发表在nature杂志的文章是:Single-cell analysis reveals a stem-cell program in human metastatic breast cancer cells ,蛮有意思的,居然是 Single-cell multiplex qPCR 数据哦!

研究者们首先通过流式预先把细胞分类,分成:basal/stem, luminal, and luminal progenitor cells这3群细胞,如下所示:

单细胞数据分析edger 单细胞数据分析的应用_数据


流式细胞分选

首先看了看3群细胞的不同病人的表达量差异情况,一般来说,做差异分析的话,组内差异肯定是要小于组间差异,不然就成为了强行找差异,如下所示,符合标准:

单细胞数据分析edger 单细胞数据分析的应用_单细胞数据分析edger_02


主成分分析看细胞亚群距离

分别是:B, basal/stem; LP, luminal progenitor; L, luminal 这3个组。

差异分析的热图就比较好理解了:

单细胞数据分析edger 单细胞数据分析的应用_单细胞数据分析edger_03


差异分析后的热图可视化

数据在GEO可以下载

Single-cell multiplex qPCR data are available at the NCBI GEO database (accession GSE70555).

其中属于Human patients - mammary cells的有271个细胞,大家可以自行下载表达矩阵,然后完成前面的PCA分析图,以及差异分析后的热图。

学徒作业

完成这个差异分析后的热图,根据表达矩阵。

差异分析涉及到的基因

因为RT-PCR是低通量的,所以依赖于生物学背景,研究者在设计这个课题的时候就确定了检测的基因是:116 genes involved in

  • stemness,
  • pluripotency,
  • epithelial-to-mesenchymal transition (EMT),
  • mammary lineage specification,
  • dormancy,
  • cell cycle
  • proliferation

当然了,后面有很多精彩的分析,包括看肿瘤转移到不同器官:BM, bone marrow; BR, brain; LN, lymph node; LU, lung; PB, peripheral blood; T, tumour. 就不一一讲解啦。

写到最后

如果你也想开启自己的生物信息学数据处理生涯,但是自学起来困难重重,还等什么呢,赶快行动起来吧!参加我们生信技能树官方举办的学习班:

  • 数据挖掘学习班第8期(线上直播3周,马拉松式陪伴,带你入门),原价4800的数据挖掘全套课程, 疫情期间半价即可抢购。
  • 生信爆款入门-第10期(线上直播4周,马拉松式陪伴,带你入门),原价9600的生信入门全套课程,疫情期间3.3折即可抢购。

生信技能树的粉丝都知道我们有一个全国巡讲的良心学习班,口碑爆棚,生物信息学入门省心省时省力!先看看大家的反馈吧:

  • 数据挖掘第一期学习反馈
  • 数据挖掘课程能带给你什么收获
  • 站在巨人的肩膀上看风景
  • 欢迎加入生信技能树小圈子
  • “生信入门过半“感想
  • 为什么选择生信技能树生信入门全球听(一个月马拉松式授课)
  • 花了那么多时间兜兜转转,我终于找对了门
  • 我一路风尘仆仆赶来,还好没和你擦肩