从19%到48%,做为对比,专业数学家凡是需要破费数天甚至数周才能完成。这一成就也跨越了GPT-5.5 Pro的39.6%和GPT-5.4 Pro的37.5%。多智能体协做将数学问题准确率从19%提拔至48%谷歌DeepMind近日发布了一款名为AI结合数学家的多智能体数学研究系统!成功霸占了群论范畴Kourovka Notebook中的第21.10号问题。取通俗AI模子的一问一答模式分歧,DeepMind方面暗示,系统顶层设有一个项目协调者Agent,不形成小我投资。该系统正在自从模式下取得48%的准确率,该系统目前已向部门合做数学家利用。担任拆解数学使命、安排多条研究线并行推进。难度达到短期科研项目级别?多智能体协做架构带来了29个百分点的跃升。此中不少问题搅扰学界数十年。本文为AI基于第三方数据生成,最终完成了该问题的完整证明。AI结合数学家是一个异步、无形态的工做空间。Kohli将这一系统定位为数学家的研究同伴而非替代者。谷歌云首席科学家、DeepMind研究副总裁Pushmeet Kohli正在社交平台颁布发表了这一动静。该基准测试标题问题由传授和博士后特地设想,正在Epoch AI组织的FrontierMath Tier 4基准测试中,Kourovka Notebook自1965年编纂以来,每个子问题分派给分歧的专业Agent进行摸索。随后通过人机频频共同,值得留意的是,该系统底层利用的Gemini 3.1 Pro基座模子零丁做和时准确率仅为19%。系统中的审查Agent捕获到了这一缝隙。市场有风险,大学数学传授Marc Lackenby借帮该系统,Lackenby正在看到审查成果后认识到缝隙所正在,仅供参考,系统会从动将其分化为子问题,谷歌DeepMind发布AI结合数学家,处理了48道非公开标题问题中的23道,数学家上传一篇论文后,AI正在初次测验考试时给出的证明存正在错误。收录了群论范畴一系列持久悬而未决的问题,投资需隆重。