
2026年6月,中南大学湘雅体系研究团队在《Signal Transduction and Targeted Therapy》发表综述文章,题为“Multi-omics and artificial intelligence for precision drug discovery and potential clinical applications”。文章系统梳理了多组学与人工智能在药物研发全流程中的应用进展。

背景
药物研发长期面临高成本和高失败率的挑战。统计数据显示,一个创新药从发现到上市平均需投入超过26亿美元,而临床成功率仅约10%。这种现象在药物研发界被称为“Eroom定律”,表明尽管技术水平提升,药物研发效率并未改善。传统研发模式依赖“一药一靶点”策略。然而,复杂疾病如癌症、神经退行性疾病及自身免疫疾病显示,疾病往往是多层级、多分子交互作用导致的网络失衡。一个驱动突变不仅会改变基因表达模式,还会重塑蛋白互作网络、影响代谢状态,并进一步改变肿瘤微环境中的免疫细胞组成。类似的复杂交互同样存在于神经退行性疾病和慢性炎症疾病中,因此药物研发必须从找到单个异常分子转向理解整个疾病系统。
多组学在药物发现中的应用
多组学技术为药物研发提供了系统级视角,其优势不仅在于整合多种数据类型,更在于能够揭示疾病运行的多层次网络机制,突破传统单组学分析的局限。通过整合基因组、转录组、蛋白组、代谢组及微生物组数据,研究人员可以在单细胞和空间分辨率下解析疾病驱动节点、细胞类型特异性信号以及微环境因素,为靶点发现、药物重定位和原创化合物设计提供可靠依据。例如,在乳腺癌和非小细胞肺癌中,多组学分析不仅能够识别驱动突变和异常表达基因,还能揭示关键代谢通路异常和免疫细胞浸润模式,从而发现传统方法无法识别的治疗靶点。
单细胞测序技术(scRNA-seq、scATAC-seq)和空间组学(如MERFISH、Visium)让研究者不再只看到组织平均信号,而是每一个细胞在组织中的状态及空间位置。例如在前列腺癌研究中,结合空间代谢组学与肝特异性转录组学,研究人员可以在斑马鱼模型中追踪药物代谢和分布路径,发现核心活性化合物通过调控甾体生物合成和脂肪酸代谢实现肝保护效果。这类分析不仅帮助理解药物作用机制,也为精准药物开发提供了新的策略。

图1 多组学在药物研发中的应用
多组学数据整合还极大推动了药物重定位和原创化合物发现。药物重定位利用已有药物的安全性数据和疾病多组学特征,结合药物诱导的基因和蛋白变化,快速预测潜在疗效。阿尔茨海默病(AD)研究中,多组学分析帮助识别出原本用于其他疾病的候选分子,例如Baricitinib等,为神经退行性疾病提供新的治疗方向。同时,多组学数据可用于原创药物设计,从确定治疗靶点到预测干预效果,结合虚拟筛选和基于生成模型的分子设计(如GANs、RL算法),可以直接生成候选化合物并进行ADMET预测,实现从发现到合成的闭环药物研发。
单细胞多组学还可以进行基因调控网络推断和扰动预测,例如利用CRISPR干扰(CRISPRi)或化学扰动模拟预测细胞响应,为识别耐药细胞群和药物敏感性提供精确数据。在肿瘤研究中,这一方法可识别耐药细胞聚集区、免疫抑制微环境以及肿瘤相关成纤维细胞网络,为个性化靶向药物开发提供决策支持。



人工智能在药物发现中的作用
随着多组学数据量和维度的急剧增加,传统统计学方法已难以处理复杂的非线性关系。AI,尤其是深度学习、图神经网络(GNN)、Transformer和生成模型,已经成为解析这些复杂数据的核心工具。在药物研发中,AI不仅可以预测靶点和候选药物,还能模拟分子与靶点的相互作用,评估毒性,并对药物设计进行优化。文章重点介绍了单细胞基础模型scGPT,这是生命科学领域首个真正意义上的基础模型,其训练数据覆盖3300万个单细胞转录组、51个组织和441项研究,能够理解“细胞语言”,进行细胞注释、多组学对齐、扰动预测和调控网络推断,为未来预测实验结果和药物效应奠定基础。

图2 AI用于药物设计
生成式AI在药物设计中的应用也极具颠覆性,通过学习化学结构和药物活性信息,AI可以直接生成新分子、预测ADMET性质,并设计可行的合成路线,从而形成闭环药物设计体系,大幅度缩短研发周期。例如,Tu等使用大语言模型和GNN筛选出RIPK3抑制剂HG9-91-01,用于急性青光眼的神经保护研究;FormulationDT平台结合AI实现PROTAC药物设计优化,有效提升效率并降低研发风险。

图3 AI用于预测药物间相互作用
AI还能够整合电子健康记录(EHRs)、药物数据库(如ChEMBL、DrugBank)和患者多组学数据,辅助药物重定位、候选分子优先筛选和个性化剂量设计。例如在非小细胞肺癌和食管癌中,通过多组学数据分析,AI预测治疗反应,实现精准药物选择。在抗菌药物开发中,D-MPNN模型利用分子图和SMILES序列预测Escherichia coli和Acinetobacter baumannii的活性化合物,并通过Drug Repurposing Hub验证毒性和药代特性,显著提高发现效率。

图4 AI用于药物安全性预测


多组学与AI驱动疾病药物研发
神经退行性疾病
在阿尔茨海默病研究中,多组学与AI结合帮助研究人员识别疾病亚型,表明过去AD被视为单一疾病的假设是错误的。通过整合脑组织和外周血数据,研究人员能够划分不同分子亚型,不同亚型表现出不同的炎症状态、代谢特征和淀粉样蛋白特征,从而可针对性地开展药物重定位和个体化治疗。AI工具如DRIAD和AlzGPS已用于筛选候选药物,帮助开发精准医疗方案。

图5 通过多组学和人工智能集成进行药物开发的示例

肿瘤
肿瘤研究已经从关注癌细胞本身,转向分析整个肿瘤生态系统。空间多组学和单细胞技术揭示了肿瘤微环境中免疫细胞、成纤维细胞和血管系统的复杂互作,这些因素共同决定治疗反应。整合TCGA、ICGC以及空间蛋白组学数据,AI模型能够构建肿瘤生态系统预测模型,实现治疗响应预测、生物标志物发现和耐药机制解析,从而为精准抗癌药物开发提供重要支持。

心血管疾病
在心血管疾病中,多组学与AI的结合也提供了新的靶点和干预策略。通过整合遗传学、转录组学、蛋白组学及代谢组学数据,研究者发现了传统方法难以识别的关键调控节点,为心力衰竭、动脉粥样硬化及心肌重构等疾病提供了新型治疗思路。
多组学与AI促进精准临床试验设计
临床试验通常是药物研发中最昂贵和最容易失败的环节。AI结合多组学数据能够进行精准患者分层、疗效预测、入组优化和动态试验调整。例如,小分子INS018_055在18个月内完成从发现到I期临床验证,充分展示了AI驱动临床设计缩短开发周期、提高试验成功率的潜力。通过模拟数字孪生患者,AI可预测不同患者的响应和耐药风险,实现更精准的入组和剂量设计。

图6 多组学与人工智能的融合促进精准药物临床试验设计

挑战与未来展望
尽管多组学与AI展现出巨大潜力,但仍存在数据标准化不完善、算法可解释性不足、临床验证难度高以及伦理与法规约束等问题。未来发展方向包括建立统一的数据标准和分析平台,发展面向生物医学的专用基础模型,并通过数字孪生、多模态AI和可解释算法实现药物研发全流程智能化和可持续优化。

图7 多组学和人工智能的整合促进药物发现
总结
多组学与人工智能的融合正在重新定义药物研发。多组学负责构建疾病全景图谱,人工智能负责理解和解析这些图谱,从而形成从靶点发现、药物设计、毒性评估到临床试验优化的闭环流程。随着基础模型和生成式AI的进一步发展,药物研发正在迈向数据驱动、系统生物学驱动和精准化的新时代,为个体化治疗和精准医疗奠定坚实基础。
参考链接:
https://doi.org/10.1038/s41392-026-02631-6
--------- End ---------