声称“媲美人类专家”,谷歌 Gemini 1.5 Pro 数学版“提智”:MATH 基准准确率 91.1%
2024-05-23 08:30:51 AI 171观看
摘要 5 月 21 日消息,谷歌公司上周发布技术报告,表示 Gemini 1.5 Pro 模型在经过专门的数学领域训练之后,大幅提高了数学成绩,并成功解决了国际数学奥林匹克竞赛的部分问题。谷歌针对数学场景有针对性地训练 Gemini 1.

5 月 21 日消息,谷歌公司上周发布技术报告,表示 Gemini 1.5 Pro 模型在经过专门的数学领域训练之后,大幅提高了数学成绩,并成功解决了国际数学奥林匹克竞赛的部分问题。oKr28资讯网——每日最新资讯28at.com

oKr28资讯网——每日最新资讯28at.com

谷歌针对数学场景有针对性地训练 Gemini 1.5 Pro 模型,并通过 MATH 基准、美国数学邀请考试( AIME) 和谷歌内部的 HiddenMath 基准进行测试。oKr28资讯网——每日最新资讯28at.com

根据谷歌的数据,数学型 Gemini 1.5 Pro 在数学基准测试中的表现“与人类专家的表现相当”,与标准的非数学型 Gemini 1.5 Pro 相比,数学型 Gemini 1.5 Pro 在 AIME 基准测试中解决的问题明显增多,在其他基准测试中的得分也有所提高。oKr28资讯网——每日最新资讯28at.com

oKr28资讯网——每日最新资讯28at.com

oKr28资讯网——每日最新资讯28at.com

谷歌官方分享的三个示例中,两个是由数学专用的 Gemini 1.5 Pro 解决的,而一个是由标准的 Gemini 1.5 Pro 变体错误解决的。这些问题通常要求解题者回忆代数中的基本数学公式,并依靠它们的分段和其他数学规则得出正确答案。附上相关截图如下:oKr28资讯网——每日最新资讯28at.com

oKr28资讯网——每日最新资讯28at.com

oKr28资讯网——每日最新资讯28at.com

oKr28资讯网——每日最新资讯28at.com

除了问题之外,谷歌还分享了 Gemini 1.5 Pro 基准测试的重要细节。这些数据表明,在所有五项基准测试成绩中,Gemini 1.5 Pro 都领先于 GPT-4 Turbo 和亚马逊的 Claude。oKr28资讯网——每日最新资讯28at.com

谷歌表示数学衍生版 Gemini 1.5 Pro 单个样本 MATH 基准准确率为 80.6%,在对 256 个解决方案进行采样并选择一个候选答案时(rm@256),准确率达到 91.1%。oKr28资讯网——每日最新资讯28at.com

参考oKr28资讯网——每日最新资讯28at.com

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of contextoKr28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-4373-0.html声称“媲美人类专家”,谷歌 Gemini 1.5 Pro 数学版“提智”:MATH 基准准确率 91.1%

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:火山豆包大模型价格清单公布:支持“预付 后付”双模式,号称“国内最高并发标准”

下一篇:振兴乡村发展 助力青少年教育 中国三星连续十一年蝉联企业社会责任榜外企第一

最新热点