DeepMind AI AlphaGeometry2:几何解题高手,超越奥数金牌选手!
2025-02-08 12:20:27 AI 42观看
摘要近日,科技界迎来了一则振奋人心的消息:谷歌DeepMind实验室的人工智能系统AlphaGeometry2,在攻克国际数学奥林匹克竞赛(IMO)中的几何难题方面,取得了令人瞩目的成就。据悉,该系统的解题能力甚至超越了历年的金牌平均水平。Alp

近日,科技界迎来了一则振奋人心的消息:谷歌DeepMind实验室的人工智能系统AlphaGeometry2,在攻克国际数学奥林匹克竞赛(IMO)中的几何难题方面,取得了令人瞩目的成就。据悉,该系统的解题能力甚至超越了历年的金牌平均水平。VEA28资讯网——每日最新资讯28at.com

AlphaGeometry2是DeepMind在今年早些时候推出的AlphaGeometry系统的升级版。据DeepMind研究人员最新发布的论文显示,该系统能够解答过去25年间国际数学奥林匹克竞赛中84%的几何题目。国际数学奥林匹克竞赛作为全球顶尖的高中生数学赛事,其难度不言而喻。而DeepMind认为,探索解决复杂几何问题的新方法,可能是推动人工智能向更高层次发展的关键。VEA28资讯网——每日最新资讯28at.com

VEA28资讯网——每日最新资讯28at.com

数学定理的证明或逻辑解释,往往需要深厚的推理能力和从众多可能性中挑选最佳解题路径的智慧。DeepMind的这一发现,预示着这些解题技能或将成为未来通用人工智能模型不可或缺的一部分。去年夏天,DeepMind曾展示了一个结合AlphaGeometry2与AlphaProof(一种专注于形式化数学推理的AI模型)的系统,该系统在2024年国际数学奥林匹克竞赛中成功解答了6个问题中的4个,展现出了强大的解题实力。VEA28资讯网——每日最新资讯28at.com

AlphaGeometry2的核心组件包括谷歌Gemini系列AI模型中的语言模型以及一个“符号引擎”。Gemini模型与符号引擎协同工作,后者依据数学规则推导出问题的解决方案,并为几何定理提供确凿的证明。然而,由于将证明转化为AI可理解格式的挑战性,以及几何训练数据的稀缺性,DeepMind为AlphaGeometry2的语言模型专门创建了合成数据,生成了超过3亿个不同复杂度的定理和证明。VEA28资讯网——每日最新资讯28at.com

VEA28资讯网——每日最新资讯28at.com

为了验证AlphaGeometry2的解题能力,研究团队从过去25年的国际数学奥林匹克竞赛中精心挑选了45个几何问题,涵盖线性方程和需要在平面上操作几何对象的题目,并将其扩展为一个包含50个问题的更大集合(部分问题因技术原因被拆分为两个)。据论文记载,AlphaGeometry2成功解答了其中的42个问题,得分超越了平均金牌得主的40.9分。VEA28资讯网——每日最新资讯28at.com

尽管AlphaGeometry2取得了显著成就,但它也面临着一些局限性。特别是,一个技术问题导致该系统无法处理涉及可变数量点、非线性方程和不等式的问题。虽然AlphaGeometry2并非首个在几何问题上达到金牌水平的AI系统,但它是首个在如此广泛的问题集上实现这一壮举的系统。VEA28资讯网——每日最新资讯28at.com

在另一组更具挑战性的国际数学奥林匹克竞赛题目测试中,AlphaGeometry2的表现同样有所保留。DeepMind团队额外挑选了29个由数学专家提名但尚未出现在比赛中的难题,而AlphaGeometry2仅成功解答了其中的20个。尽管如此,AlphaGeometry2的成就仍然为人工智能在数学领域的应用开辟了新的道路。VEA28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
中国移动App新增线上销户与重开功能,操作便捷但需注意限制条件
中国移动App新增线上销户与重开功能,操作便捷但需注意限制条件
Meta PARTNR计划:探索人机协作家务新时代
Meta PARTNR计划:探索人机协作家务新时代
《纪元117:罗马和平》Beta测试启动,玩家抢先体验罗马总督生涯
《纪元117:罗马和平》Beta测试启动,玩家抢先体验罗马总督生涯
华为FreeArc开放式耳机海外上市,定价约904元,适配各种耳型
华为FreeArc开放式耳机海外上市,定价约904元,适配各种耳型
OpenAI联合创始人舒尔曼新动向:或将加入前CTO神秘创业公司
OpenAI联合创始人舒尔曼新动向:或将加入前CTO神秘创业公司
惠普EliteBook X G1a商务本内存再升级,128GB LPDDR5x-8533配置曝光
惠普EliteBook X G1a商务本内存再升级,128GB LPDDR5x-8533配置曝光
热门内容
  • DeepSeek两日连崩,官方回应:技术服务稳定性受多重因素挑战
  • 硅基流动携华为云首发DeepSeek R1&V3大模型推理服务,性能媲美高端GPU
  • DeepSeek大规模招聘,年薪百万岗位等你来,AI人才你准备好了吗?
  • DeepSeek出故障:深度思考与联网搜索功能齐“罢工”?
  • DeepSeek背后商业网络揭秘:梁文锋关联15家企业,商标申请竞争激烈
  • 硅基流动携手华为云昇腾,首发DeepSeek R1&V3推理服务,赋能开发者
  • 梁文峰:从对冲基金经理到DeepSeek创始人,如何改写AI版图?
  • DeepSeek故障再现,用户对话受阻,官方尚未回应
  • 三星Galaxy S25系列真机曝光,明日发布会将有何惊喜?
  • DeepSeek注册难,官方:遭大规模恶意攻击,稍后再试
  • DeepSeek走红全球,高薪招聘实习生,日薪最高可达千元!
  • DeepSeek凌晨发布Janus-Pro,多模态大模型性能超越OpenAI DALL-E 3
  • 三星Galaxy S25系列评测:AI大升级,Ultra版全面领跑
  • DeepSeek深夜发布Janus-Pro,性能超越OpenAI DALL-E 3引关注
  • 深度求索北京大招聘,核心研发岗高薪,实习生日薪可达千元
本栏最新
OpenAI联合创始人舒尔曼新动向:或将加入前CTO神秘创业公司
OpenAI联合创始人舒尔曼新动向:或将加入前CTO神秘创业公司
浙江东方涨停澄清:我们投资的是“深度搜索”,非爆火的“深度求索”!
浙江东方涨停澄清:我们投资的是“深度搜索”,非爆火的“深度求索”!
DeepMind AI破解数学奥赛几何题,金牌水平不在话下?
DeepMind AI破解数学奥赛几何题,金牌水平不在话下?
2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?
2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?
努比亚Z60 Ultra新系统内测:流畅性提升,这些故障终得修复!
努比亚Z60 Ultra新系统内测:流畅性提升,这些故障终得修复!
软银400亿美金大手笔!即将成为OpenAI最大投资方
软银400亿美金大手笔!即将成为OpenAI最大投资方

本文链接:http://www.28at.com/showinfo-45-10573-0.htmlDeepMind AI AlphaGeometry2:几何解题高手,超越奥数金牌选手!

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:亚马逊Q4财报亮点:云服务增速强劲,2025年AI业务成投资重心

下一篇:软银400亿美金力挺OpenAI,成最大股东,中国AI初创公司也引关注

最新热点