DeepMind AI破解数学奥赛几何题,金牌水平不在话下?
2025-02-08 08:26:23 AI 27观看
摘要近期,科技界迎来了一项令人瞩目的成就:谷歌DeepMind实验室的人工智能系统AlphaGeometry2,在攻克国际数学奥林匹克竞赛(IMO)中的几何难题上,取得了前所未有的突破,其解题能力甚至超越了历年的金牌平均水平。AlphaGeometry2是D

近期,科技界迎来了一项令人瞩目的成就:谷歌DeepMind实验室的人工智能系统AlphaGeometry2,在攻克国际数学奥林匹克竞赛(IMO)中的几何难题上,取得了前所未有的突破,其解题能力甚至超越了历年的金牌平均水平。iYn28资讯网——每日最新资讯28at.com

AlphaGeometry2是DeepMind在今年早些时候推出的AlphaGeometry系统的升级版。据DeepMind团队最新发布的论文显示,这一AI系统能够解答过去25年间国际数学奥林匹克竞赛中出现的84%的几何题目。国际数学奥林匹克竞赛作为面向全球高中生的顶级数学赛事,其难度与挑战性不言而喻。而DeepMind认为,探索解决复杂几何问题,尤其是欧几里得几何问题的新方法,或许能够为开发更强大的人工智能提供关键线索。iYn28资讯网——每日最新资讯28at.com

iYn28资讯网——每日最新资讯28at.com

在数学领域,证明定理或解释定理为何成立,不仅需要严密的逻辑推理能力,还需要从众多可能的解题路径中做出正确选择。如果DeepMind的见解正确,那么这些解题技巧将是未来构建通用人工智能模型不可或缺的要素。iYn28资讯网——每日最新资讯28at.com

去年夏天,DeepMind曾展示过一个结合AlphaGeometry2与AlphaProof(一个专注于形式化数学推理的AI模型)的系统,该系统成功解答了2024年国际数学奥林匹克竞赛中的4道题目,占总数6题的2/3。这一成果预示着,类似的方法不仅限于几何问题,还有望拓展至数学乃至科学的其他领域,比如辅助复杂的工程计算。iYn28资讯网——每日最新资讯28at.com

iYn28资讯网——每日最新资讯28at.com

AlphaGeometry2的核心组件包括谷歌Gemini系列AI模型中的语言模型,以及一个强大的“符号引擎”。Gemini模型与符号引擎协同工作,符号引擎利用数学规则推导出问题的解决方案,并为给定的几何定理提供有效的证明。iYn28资讯网——每日最新资讯28at.com

然而,将证明转化为AI可理解的格式并非易事,加之可用的几何训练数据稀缺,给研究带来了不小的挑战。为此,DeepMind为AlphaGeometry2的语言模型专门生成了合成数据,这些数据涵盖了超过3亿个不同复杂度的定理和证明,为AI的训练提供了坚实的基础。iYn28资讯网——每日最新资讯28at.com

为了验证AlphaGeometry2的解题能力,研究团队从过去25年的国际数学奥林匹克竞赛中精选了45道几何题目,这些题目涉及线性方程和需要在平面上操作的几何对象。随后,他们将这些题目“转化”为一个包含50道题目的更大集合(部分题目因技术原因被拆分为两题)。据论文所述,AlphaGeometry2成功解答了其中的42题,得分超过了平均金牌得主的40.9分。iYn28资讯网——每日最新资讯28at.com

尽管如此,AlphaGeometry2仍存在一定的局限性。例如,它无法处理涉及可变数量点、非线性方程和不等式的问题。尽管AlphaGeometry2并非首个达到几何问题金牌水平的AI系统,但它是首个在如此广泛的问题集上实现这一成就的系统。iYn28资讯网——每日最新资讯28at.com

在另一组更具挑战性的题目测试中,AlphaGeometry2的表现略显不足。DeepMind团队额外选取了29道由数学专家提名但尚未出现在竞赛中的题目,AlphaGeometry2仅成功解答了其中的20题。iYn28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
DeepSeek融资传闻引发热议,阿里股价大涨,AI新贵能否再创辉煌?
02-07
点击查看更多 +
全站最新
《哪吒之魔童闹海》上映11天,预测票房直冲110亿大关!
《哪吒之魔童闹海》上映11天,预测票房直冲110亿大关!
小米汽车提速上市,雷军亲自督战!金车标引发热议
小米汽车提速上市,雷军亲自督战!金车标引发热议
以旧换新政策升级,2300万辆乘用车迎来车市新机遇!
以旧换新政策升级,2300万辆乘用车迎来车市新机遇!
《神奇女侠》游戏重启耗资过亿,华纳游戏部门去年巨亏3亿
《神奇女侠》游戏重启耗资过亿,华纳游戏部门去年巨亏3亿
《怪物猎人:荒野》二测火爆开启,Steam在线人数已超25万!
《怪物猎人:荒野》二测火爆开启,Steam在线人数已超25万!
腾讯游戏全球领跑!2025年1月收入榜《王者荣耀》等再创佳绩
腾讯游戏全球领跑!2025年1月收入榜《王者荣耀》等再创佳绩
热门内容
  • DeepSeek两日连崩,官方回应:技术服务稳定性受多重因素挑战
  • 硅基流动携华为云首发DeepSeek R1&V3大模型推理服务,性能媲美高端GPU
  • DeepSeek大规模招聘,年薪百万岗位等你来,AI人才你准备好了吗?
  • DeepSeek出故障:深度思考与联网搜索功能齐“罢工”?
  • DeepSeek背后商业网络揭秘:梁文锋关联15家企业,商标申请竞争激烈
  • 硅基流动携手华为云昇腾,首发DeepSeek R1&V3推理服务,赋能开发者
  • 梁文峰:从对冲基金经理到DeepSeek创始人,如何改写AI版图?
  • DeepSeek故障再现,用户对话受阻,官方尚未回应
  • 三星Galaxy S25系列真机曝光,明日发布会将有何惊喜?
  • DeepSeek注册难,官方:遭大规模恶意攻击,稍后再试
  • DeepSeek走红全球,高薪招聘实习生,日薪最高可达千元!
  • DeepSeek凌晨发布Janus-Pro,多模态大模型性能超越OpenAI DALL-E 3
  • 三星Galaxy S25系列评测:AI大升级,Ultra版全面领跑
  • DeepSeek深夜发布Janus-Pro,性能超越OpenAI DALL-E 3引关注
  • 深度求索北京大招聘,核心研发岗高薪,实习生日薪可达千元
本栏最新
DeepMind AI破解数学奥赛几何题,金牌水平不在话下?
DeepMind AI破解数学奥赛几何题,金牌水平不在话下?
2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?
2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?
努比亚Z60 Ultra新系统内测:流畅性提升,这些故障终得修复!
努比亚Z60 Ultra新系统内测:流畅性提升,这些故障终得修复!
软银400亿美金大手笔!即将成为OpenAI最大投资方
软银400亿美金大手笔!即将成为OpenAI最大投资方
紫光新华三拥抱DeepSeek大模型,灵犀使能平台已纳管上架V3与R1版本
紫光新华三拥抱DeepSeek大模型,灵犀使能平台已纳管上架V3与R1版本
小米相册AI写真功能即将下线,你体验过吗?
小米相册AI写真功能即将下线,你体验过吗?

本文链接:http://www.28at.com/showinfo-45-10533-0.htmlDeepMind AI破解数学奥赛几何题,金牌水平不在话下?

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:OpenAI德国设新办,加速欧盟布局步伐

下一篇:2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?

最新热点