生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_高性能计算

医药研发 | 细胞治疗 | IND

生物分子 | 冷冻电镜 | NDA

分子模拟|AlphaFold|PCC

在生命科学、深度学习、冷冻电镜、细胞治疗、分子模拟、蛋白质组学、疾病建模、靶点识别、药物设计、AlphaFold的飞速发展下,中国医药研发领域、小分子研究领域得到飞速发展,已经成为全球第二大市场。


生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_数据_02

医药研发现状及未来发展趋势


我国生物医药研发支出累计环比增长

随着医改的稳步推进,传统的以销售为导向的扩张模式难以为继,国内药企面临创新转型。从2016年到2020年,生物医药上市公司的研发投入将继续扩大。2020年,我国生物医药上市公司研发支出达到115.34亿元,同比增长37.10%。2021年上半年,我国生物医药上市公司研发支出已达69.78亿元,预计全年研发支出将进一步增加。总体来看,研发投入力度的增加将在一定程度上帮助企业加快生物医药产品的研究成果转化。


生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_数据_03



我国新药申请上市情况乐观,新产品研发活跃

从转化结果来看,我国新药上市情况乐观。2017-2020年,国内新药申请上市数量呈波动趋势,2018年达到峰值45件。2019年,药审中心受理国内一类创新药上市申请25个(16个品种),2020年上市申请43个。


生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_高性能计算_04


创新药物是指由企业或研究机构原创,具有新的化学结构和新的治疗用途,并拥有自主知识产权专利的药物。对特定疾病有显著疗效,提高治疗率,延长患者生存期。在活动方面,国内生物制药公司在研发活动中活跃。由于2020年新冠肺炎疫情爆发,有三家制药公司已在新冠肺炎研发投资疫苗和检测试剂。此外,另有药企以人用疫苗和免疫球蛋白为主要研究方向。


我国创新药物研究发展能力较强,投入及产出需改善

尽管中国生物医药产业研发投资和成果转化较好,但与发达国家相比,中国创新药物研发在许多指标上仍有待提高。在研发投入能力和产出方面,中国与发达国家存在一定差距。即使与水平相当的印度相比,新药研发投入也有一定差距。目前,我国政府越来越重视自主知识产权创新药物的研发,并出台了一系列激励政策,取得了一定的成效。但是,为了不断提高我国创新药物的研发能力,我国政府应不断调整和完善相关政策,为我国医药企业创新药物研发创造良好的政策环境。

生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_服务器_05

注:强:★★★,较强:★★☆,一般:★★,较弱:★☆,弱:★,未统计:――


我国创新药物研发趋势

虽然中国创新药物的研发水平与世界领先国家相比还有很大差距,但未来,鉴于中国医药外包行业在世界上的领先地位和巨大的市场,中国有实力成为全球药物创新中心,并且随着新冠肺炎疫苗在国际上的日益普及,国家规划对生物医药的高度重视,中国生物医药行业药物研发未来可期。

生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_数据_06


生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_高性能计算_07

AI技术为药物研发带来的变革与突破

在海量的知识点中,如何全面地寻找和评价决定性的关系和链接,如何建立相互作用,或者是推测关键待发现的知识点?从这个角度来看,人为学习的效率显然是很低的。而AI从底层上来讲,如果人工智能做到整个知识图谱逻辑性的建立,AI去搜寻答案肯定比人为要强很多,并且AI具有搜寻地更全面更深入的优点。


药物开发的各阶段中,前期的基于疾病机理的靶点发现、生物标志物的发现、后期的临床试验设计、疗效预测,目前都还基本处于数据收集分析,或者说大数据的时代。


由于缺乏足够的经过验证的结果,以及前期相对应的关联数据,所以深度学习在缺乏足够的数据和前期的成功的经过验证的逻辑关系等限制条件下,还需要更多试验数据和人本身认知的进步才有机会逐渐成熟。


但AI在某些临床实践中,诸如病理分析判断等环节上应用的比较成功,也是因为积累了足够多的数据和病理医生的实践经验。但是从药物开发的临床设计和试验数据收集环节来看,AI还没到那个真正能突破的阶段。相信未来随着更多的临床数据、大数据共享的普及,AI算法能够脱颖而出。


就目前来看,人工智能在药物设计上,尤其是小分子,甚至大分子药物设计上存在机遇。当然在蛋白药物开发也存在一定的机遇,比如前一段时间AlphaFold出来之后,为蛋白序列、结构、蛋白质间的相互作用的研究提供了海量数据,随着相关内在逻辑的理解逐渐深入,为AI驱动的深度学习提供了机会,将有可能真正实现突破。


生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_服务器_08

  

在医药领域里,AI遇到的瓶颈

一、认知的局限和数据的质量

突破认知局限是更有挑战的,高质量的数据可以通过聚焦的投入去生成。


二、人们对AI应用的理解

人需要理解规则,输入输出端一定的内在逻辑联系,才能创造出好的AI应用。就像下棋,要打很多经典的棋谱才能做出AlphaGo。


目前医疗领域前期的开发和后期的临床数据解读,都还不完善。但是在小分子和大分子结构及性质的数据上已经有了一定的积累,对分子序列,结构与一些分子特征,比如:亲和力,成药性等之间相互如何关联的,AI对此如果有一定的认识将大有可为。


三、算法算力存在偏差

大公司很难释放临床数据,AI只是用现有的数据进行测算,这时数据大小和量会有限制。


四、数据样本少

做临床没有太多的数据,做临床一期也就是60位病人,二期200位病人,数据是非常有限的。无法使用有限的数据得到正确答案,这也是AI遇到的难题。


生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_高性能计算_09


生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_高性能计算_10

冷冻电镜助力药物研发

一直以来,科学家们都在探索基础生命科学,探索细胞中的生命规律,为人类健康和其他学科提供参考。分子是生命中最小的单位,生命科学研究逐渐发展到微观生物分子的结构和功能的研究阶段,以逐步加深对生命过程的认知。充足的基础研究不仅可以帮助我们深入了解生命过程,还有助于改善人类健康和生活质量。科学家可以通过生命科学研究帮助识别新药靶点,并根据靶点进行药物筛选,从而提高药物研究的成功率、安全性和有效性。随着生物制品,特别是抗体大分子的发展,冷冻电子显微镜越来越多地用于分析活性生物分子的结构。

冷冻电子显微镜用于分析生物样品的三维结构,包括单颗粒分析、微晶电子衍射和冷冻电子断层扫描。冷冻电镜单颗粒分析技术Cryo-EM SPA是一种以单个粒子形式分析生物分子组装的新方法。通过快速冷冻负染电镜获得的适当浓度的生物分子样品,生物大分子以近自然状态存在于无定形冰中,然后对冷冻样品进行筛选、数据采集和三维结构分析,获得高分辨率的生物分子结构。其工作过程如图。

生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_数据_11

冷冻电镜单粒子分析技术可以在分子水平进行细致的研究,分析基于结构的药物研发的分子基础,而冷冻电子断层成像技术可以在亚细胞水平观察原位细胞环境中靶分子的作用位点和作用机制,相信在不久的将来可以用于进一步确认基于结构的药物研发的可靠性。电子衍射不仅可以分析小分子的微晶结构,还可以补充现有技术分析生物大分子及其化合物的微晶结构。

分子生物学兴起后,靶向药物发现逐渐成为主流的新药研发模式。靶点-受体相互作用的靶和结合位点通常通过结构生物学方法获得。以目标结构和结合位点为模型进行虚拟筛选,通过高通量方法获得可能结合的潜在分子。此外,通过结构生物学方法直接分析目标潜在分子的高分辨率结构,并确认潜在分子。2014年,低温电子显微镜的“分辨率革命”使其成为获得3种以上结构的常规技术。高分辨率的结构可以清晰地描述靶分子和潜在分子之间相互作用的信息,包括结合表位、配体手性等。为潜在化合物的结构改造提供指导。

生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_服务器_12

新的疾病或流行病爆发需要从头进行药物设计研究,而这些反应灵敏的药物研发需要大量基础研究的积累。冷冻电镜技术不仅非常适合结构生物学的基础研究,而且有助于加速结构药物的研发。例如,在2020年新冠肺炎疫情期间,德克萨斯大学奥斯汀分校的Jason S. McLellan课题组和西湖大学的周强课题组先后分析了新型冠状病毒跨膜刺突蛋白在膜融合前的细胞外结构域的三维结构和人类受体全长血管紧张素转换酶2(ACE2)蛋白-新型冠状病毒刺突蛋白复合物的近原子分辨率结构。不仅阐明了病毒感染人体的机制,而且促进了基于结构研究的合理疫苗设计和药物研发,筛选出针对刺突蛋白的中和抗体候选物和重组疫苗候选物。

生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_数据_13

近年来,冷冻电镜技术已被全世界公众所熟知,并被越来越多的学术界和跨国制药企业所采用。在药物研发方面,许多跨国公司已经使用冷冻电子显微镜技术进行药物研发。


虽然冷冻电镜是一项前沿技术,但目前冷冻电镜基于其结构研发的一些药物已经进入临床试验阶段。比如葛兰素史克公司针对关键寄生虫酶研发的新型黑热病抑制剂,再生元制药公司针对新冠肺炎研发的抗体“鸡尾酒”,都已经进入临床试验阶段。相信冷冻电镜除了应用于基础研究之外,还将越来越多地应用于药物开发等其他研究领域,为人类健康做出贡献。


冷冻电镜未来的探索

冷冻电镜技术在药物研发过程中的应用实例进一步表明,该技术在药物(生物制品)质量方面具有前瞻性意义。在回顾该技术应用的同时,我们也看到了冷冻电镜在未来新药研发中的发展方向。我们相信,冷冻电子显微镜将在基于结构的药物设计、生物制剂的高级结构表征和冷链运输过程中的质量控制中发挥越来越重要的作用。


生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_数据_14

蓝海大脑助力药物研发

案例概述

清华大学药学院初始于2021年,药物分子研发是一个非常复杂且非常耗时的过程,药物分子筛选只是前期流程中的一个环节。如寻找跟蛋白病毒酶结合的小分子,由于存在不同种类或研究机构的配体(小分子)库,配体(小分子)库数量巨大,每个配体库的配体数量成千上万(甚至更大),通过实验方式测试验证是不切实际的。通过计算机数值模拟进行筛选,对不同配体的结合效果进行打分,筛选出分数高且结合模式合理的一些配体作为候选药物进行实验验证,能够有效的加速药物研发进程。

由于配体库数量巨大,在有限时间内完成筛选,同样挑战巨大。例如,配体库有10000个候选配体,每个配体平均处理时间为1.5小时,总共需要15000 个小时(625天)。因此,为在规定时间内算完,需要具备以下条件:
一、拥有强大算力的计算平台;

二、大容量存储,用于存放处理数据和计算结果;


此外,为了保证筛选计算能够高效、顺利完成,还需要计算服务,包括:

一、集群软件运行环境,保证在多机环境软件下运行,以及数据访问;

二、能够支持多任务在多机环境下并发处理的并行方案。


除计算平台外,药物筛选还需要高性能应用软件。药物筛选模拟计算包括Docking和分子动力学计算:其中Docking 耗时相对较小,常用于大量配体的初步筛选,主要软件有dock6、Autodock Vina、Glide等。分子动力学模拟计算比较耗时,测试作用的时间变化,用于对Docking初选结果进一步分析,主要软件有Gromacs,Namd,Amber等,使用GPU加速效果一般比较明显。


生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_服务器_15


方案与价值

药物小分子研发需要强大算力的高性能集群,获取这些计算资源和服务成为当下的重中之重。清华大学药学院搭建了四台A100液冷服务器、9台CPU服务器、两台高通量液冷服务器,为高性能计算环境提供基础的计算平台。

使用DOCK6 处理配体(小分子)库的对接案例时,在一个文件夹中,如mol2,存放大量的小分子文件,每个小分子处理流程是一样的,均需要与相同的受体(如病毒蛋白酶)进行计算。这时需要在短时间内提供大量GPU和超算产品,以及全天候的技术支持。搭建开放共享平台,使用高性能计算集群,用于药物研发的分子对接、分子动力学模拟、深度学习模型训练,把需要几天的计算工作缩短到几小时,速度提升8到20倍。同时为各研发老师创建不同的子账户,实现计算资源共享和数据共享。为高性能计算环境提供基础的计算平台,要实现高效的药物筛选,还需要高通量任务解决方案。

总结

清华大学药学院药物研发需要强大算力的高性能计算集群,如药物筛选需要进行大量小分子的Docking处理。药学院老师可以利用蓝海大脑高性能液冷服务器,快速构建高性能集群,获取高性能的计算实例,满足算力的需求。同时提供高通量任务处理的解决方案,使得药物筛选在多计算节点、多核上并发处理,降低任务整体执行时间。


生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?_高性能计算_16END