我们为什么需要蛋白质组学?

  1. 蛋白质组学从其他组学中带来的信息是独一无二的。
  2. 为什么要这么具体?
  • 蛋白组信息,要么鉴定,要么定量,总是依赖于时空性。
  • 蛋白主要通过互作发挥功能
  • 很多蛋白以翻译后形式存在
  1. 蛋白组和传统蛋白研究有何不同?
  • 数据获取和处理形式基于高通量和大规模的组学视角
  • 蛋白组发展极大依赖仪器的优势
  • 主要的革新是蛋白组信息、算法和大数据集驱动的

蛋白质组学是多组学的关键成员

  1. 蛋白质组学是基因组学的一种科学与逻辑的结果
  • 没有基因组数据,不能执行任何蛋白组分析
  • 蛋白组的基本观点和策略被基因组所驱动
  • 蛋白组数据对基因组注释产生新的线索
  1. 遵从中心法则,蛋白组数据是多组学信息链中重要一环
  • 蛋白组信息是不可替代的,因为它在多组学数据中的唯一性
  • 蛋白组和转录组是基因组表达水平的两种基因信息
  1. 质谱分析:蛋白质组学的基本技术
  • 质谱仪:一台可测量单个带电离子质量的仪器
  • 简单理解:一台测量分子重量的仪器,即一杆分子秤
  • 质谱仪领域是诺贝尔奖的常青树:诞生(发现质荷比),早期质谱、离子化、质量分析、串联质谱等领域
  • 两种质谱仪类型:ESI、MALDI
  • 用质谱分析蛋白谱(profiling):DDA、靶向、DIA
  • 用质谱分析代谢谱:NMR、LCMS、GCMS

蛋白质组学是一门以技术为导向的科学

  1. 蛋白谱虽然提供了资源信息,但没有提供具有方向性的生物学问题的答案
  • 理论上来说,不同的生物系统、组织、细胞、器官总是执行各种功能,说明它们具有多样的蛋白组成
  • 生物系统中的蛋白组代表了某种特征吗?目前还没答案
  • 大多数情况下,蛋白谱强调有多少蛋白被鉴定,但是这种鉴定是基于基因组注释的
  1. 生物系统中的全部蛋白仍旧是一个难题
  • 基因组分析的特点是从碎片信息组装成完整信息,然而基于质谱的蛋白组分析的特点是碎片信息如何能够代表一个完整蛋白
  • 生物系统中的蛋白存在与否不是关注点,更多关注的是多与少,能真实反映蛋白丰度和当前质谱仪水平的测量标准
  • 一个蛋白组有多大量只是蛋白组技术的指标,而非某种生物学问题的答案
  1. 蛋白质是基因功能的携带者,尽管一个蛋白质的功能是明确定义的。但是一个蛋白组的功能是难以界定的。
  • 蛋白组结果能根据蛋白状态(如丰度、修饰、互作)提供有信息的数据,帮助功能研究。
  • 从生物学系统提出的问题是非常有可能和蛋白功能相关的,但不总是需要蛋白组数据帮助。
  • 蛋白质组学只是一种蛋白质分析状态的技术,在所有涉及蛋白功能的生物学研究中,蛋白组能够提供某种贡献,但不是全部。甚至在蛋白分析技术方面,基于质谱的蛋白质组也只是其中一种。

蛋白质组可能的发展方向

  1. 蛋白组生物信息
  • 基于谱图注释对蛋白或肽段进行denovo测序
  • label-free定量蛋白组
  • 组学整合,尤其是基因组、转录组和蛋白组
  • 深度学习在数据处理方面的应用
  1. 蛋白质组分析
  • 使用组合策略对蛋白测序全覆盖
  • 独立于质谱的蛋白组学
  • 基于定量蛋白质组的抗体亲和
  • 微液相对蛋白组的重评估
  1. 临床蛋白质组
  • 在临床应用上快速、简单和精确的蛋白质组学
  • 多标志物的临床意义
  • 个体蛋白质组

精准医疗

  1. 精准医疗的三个核心因素
  • 个性化:所有生物学特征是依赖个体的
  • 准确:所有数据是先进仪器和计算分析生成
  • 大规模:多方法的大量个体样本

千人基因组计划反映人类的差异性。
癌症基因组计划证明大量突变在多变的癌症中广泛存在。
在单细胞水平上对基因组深度测序发现个体差异。
在转录组水平也具有个体差异。

  1. 个体差异是未来生物研究方向:
  • 生物学和心理特征的组成以及行为归因于个人的特性
  • 个性——遗传——环境
  • 在很长一段时间内,由于技术限制,蛋白质组分析在个体水平上,尤其是定量水平上很难被补充:肽段质谱信号检测的重复性差;液相的肽段多分级很难有一个好的并行实验;定量缺乏一种可接受的方法来准确评估肽段的丰度。
  1. SWATH:个体蛋白组的一条线索
  • 为了更可能多的获得质谱信号,质谱仪通过增加扫描速度和质谱信号获取方式(DDA到DIA)来改善
  • 为简化液相条件,产生本地或公共离子库以及单一液相来进行肽段分离和鉴定
  • 为建立一种全局的定量标准,肽段质谱信号作为定量来源。
  1. 为什么是SWATH被采纳?
  • 优势:适应所有样本,无论是基因表达相似的还是不同的背景;大样本而非小样本;通过整合一级和二级质谱信号来精确定量肽段;通过单液相和全局肽段校正来保留液相分离过程更少的实验误差;重新利用数据和离子库。
  • 劣势:构建离子库耗时,且它的质量直接影响蛋白鉴定;数据质量依赖于样本数;作为一种新的定量方法,还没有像labelfree一样被公认。
  • SWATH的新见解:为了提高DIA对肽段鉴定的算法,二级质谱加RT来利用二级质谱信号或许可行;通过整合标准肽段到每个样本来对肽段进行全局校正;通过考虑一级和二级质谱的峰面积来改善定量算法;加强对大数据集的计算速度。

总结

  • 作为一种技术,蛋白质组仍处于原型阶段,我们应充分认识到它还有巨大的提升空间。另一方面,蛋白质组技术不仅仅基于质谱,它应该整合其他技术,而且我们也必须关注更多的新技术。
  • 在基础研究和临床应用方面,都要和蛋白质组学发展保持同步。我们应该有一种将蛋白质组学公共教育以及和其他领域的科学家建立联系当成一种使命,只有和生物学驱动问题相伴而行,蛋白质组才能走得更快更远。



作者:Bioinfarmer,请关注同名微信公众号:Bioinfarmer。