新闻动态

    复旦大学与无限光年共建“人工智能大模型校企联合研究中心”科研成果登国际AI顶刊!徐盈辉研究员团队ActFound生物活性预测基础模型发表

    发布时间:2024-08-16浏览次数:

    复旦大学人工智能创新与产业研究院徐盈辉研究员团队携手无限光年(上海)技术有限公司、北京大学、华盛顿大学共同在国际权威期刊《Nature Machine Intelligence》上发表题为“A bioactivity foundation model using pairwise meta-learning”的科研论文,提出了一种基于元学习框架下对比学习范式构建的ActFound模型,为基于机器学习方法来解决生物湿实验数据少以及批次效应带来的可比性问题打开了新思路,推进研究范式变革。

    在药物研发中,高效且准确的预测化合物的生物活性具有重要意义。生物活性反映了小分子与生物系统中特定靶点(如蛋白质、受体或酶)相互作用并引起可测量的生物学反应的程度,是筛选潜在药物候选物、优化分子结构以及预测药物疗效和安全性的关键指标。准确预测和评估生物活性不仅可以大幅缩短药物筛选时间、降低研发成本,还能帮助研究人员理解药物作用机制,从而加速新药开发进程,为患者带来更有效、更安全的治疗方案。

    已有的基于物理的计算方法如自由能微扰(FEP)可以给出准确的生物活性预测,但是却面临着计算成本高昂的问题。深度学习方法展现出巨大潜力,但由于每个检测中化合物的数量较少以及不同检测间的测量一致性和可比性问题,导致现有的机器学习方法在生物活性预测方面的泛化能力较差。

    基于这一挑战,徐盈辉研究员团队联合合作伙伴,研发了一个由ChEMBL数据库中160万个实验测量的生物活性数据训练而成的生物活性基础模型——ActFound

    ActFound生物活性基础模型依托庞大的数据基石,囊括ChEMBL数据库中精心筛选的160万项实验验证的生物活性数据,以及横跨35,644项独特检测的综合信息。ActFound的核心思想是使用对比学习技术,通过学习同一检测中两个化合物之间的相对生物活性差异,成功规避不同检测间的不兼容难题。ActFound进一步利用元学习技术,从所有检测中共同优化模型。在六个真实世界的生物活性数据集上,ActFound展示了准确的域内预测能力和跨检测类型及分子框架的强大泛化能力。

    ActFound作为一种有效的化合物生物活性预测的基础模型,为基于机器学习的药物研发铺平了道路。

    ActFound工作示意图

    值得一提的是,ActFound具有作为领先的物理基础计算工具FEP+(OPLS4)替代品的潜力,在仅使用少量数据点进行微调的情况下,也能达到与之相媲美的卓越性能,从而为药物研发人员提供了更加灵活、高效的数据分析工具。

    审稿人认为该论文中成对学习和元学习的组合不但成功解决了活性预测的核心问题,而且还对其他领域的发展有所启发。

    评价FEP基准和肿瘤药物反应预测

    该论文是复旦大学与无限光年共建“人工智能大模型校企联合研究中心”的重要阶段性科研成果,是校企合作的成功范例,也是依托复旦大学CFFF智算平台产生的又一重磅科研成果。复旦大学人工智能创新与产业研究院徐盈辉研究员、北京大学计算机学院张铭教授和华盛顿大学计算机系肖之屏、王晟为论文的通讯作者;无限光年(上海)技术有限公司冯斌为论文的第一作者。


    徐盈辉:

    复旦大学人工智能创新与产业研究院研究员、博士生导师,复旦大学与无限光年共建“人工智能大模型校企联合研究中心”的核心成员。专注于生成式AI 与逻辑推理的融合、微观/宏观生命科学大模型研究、第一性原理计算与AI 反馈闭环系统研究。已发表SCI 论文80余篇、授权发明专利十余项。曾任阿里巴巴达摩院视觉实验室负责人,菜鸟人工智能部创始人,阿里巴巴搜索事业部基础算法负责人。荣获多项奖项:2021年,VRP 路径规划算法,入围Franz Edelman 奖决赛; 2020年,ECML-PKDD,最佳论文提名;2017年,SIGIR,最佳学生论文;2017年,SIGIR,最佳论文提名;2008年,RICOH总公司Minori award; 2005年,JNLP,日本自然语言协会年度最佳论文。


    原文链接:https://www.nature.com/articles/s42256-024-00876-w



    上一篇:坚持总会上场,做新时代的追梦人!漆远院长在复旦开学典礼上这样说

    下一篇:Nature Communications | 李昊/陆波/漆远团队揭秘“伏羲”次季节-季节预测模型 (FuXi-S2S)