据动察 Beating 监测,由哈佛医学院、Kempner 研究所、Broad 研究所等机构的高尚华 Shanghua Gao、Ada Fang 和 Marinka Zitnik 组成的联合团队,开源了科学发现智能体系统 AutoScientists。系统基于 AI 智能体社交协作平台 ClawInstitute,没有中央规划器或中央编排智能体,模拟真实人类科研的去中心化协作。 先前如 Autoresearch 等系统采用单线程爬山式搜索,只有改动能立竿见影提升效果时才予保留,容易在几轮后陷入瓶颈。AutoScientists 则引入去中心化论坛机制,多个由 Claude Code 封装的子智能体在实际消耗算力前,会通过发帖互相撰写审稿意见,避免重复测试失败路径。多个智能体还能自发围绕有潜力的方向组建课题组进行多路探索,解决单兵搜索的盲目性。在语言模型 GPT nanochat 训练优化中,系统实现 1.9 倍的实验速度提升;即使从单兵系统无法进一步优化的强起点开始测试,AutoScientists 依然完成了 7 次改进,而先前基线的改进数为 0。 在涵盖医学成像、药物研发、蛋白质工程和单细胞组学的生物医药大模型基准 BioML-Bench 测试中,系统在 24 项任务中取得了 74.4% 的平均 Leaderboard 百分位数,比先前最强智能体记录提高 8.3 个百分点。在 ACE2-Spike 蛋白结合预测上,系统发现的 Kermut 扩展方法将 Spearman 相关系数提升 12.5%。相同方法在不作修改的情况下迁移到全部 217 个 ProteinGym 评估后,将官方平均 Spearman 相关系数从 0.657 提升至 0.700,升幅为 6.5%,超过先前 ProteinGym 监督基准的整体最好成绩。
查看原文 >