DeepSeek-V3 & R1 合体:快手开源 "Auto Think " 大模型,可根据问题自动调节思考深度
2025-06-06 09:38:24 AI 37观看
摘要 6 月 4 日消息,快手 Kwaipilot 团队近日开源了 KwaiCoder-AutoThink-preview 自动思考大模型,针对近期深度思考大模型存在的“过度思考”问题进行了深入研究。团队提出了一种全新的自动思考模型训练范式,同时基

6 月 4 日消息,快手 Kwaipilot 团队近日开源了 KwaiCoder-AutoThink-preview 自动思考大模型,针对近期深度思考大模型存在的“过度思考”问题进行了深入研究。团队提出了一种全新的自动思考模型训练范式,同时基于传统强化学习算法(GRPO),提出了带有过程监督的强化学习方法 Step-SRPO,以进一步提升模型在复杂任务中的表现。o2028资讯网——每日最新资讯28at.com

o2028资讯网——每日最新资讯28at.com

据介绍,该模型融合了“思考”和“非思考”能力,号称“DeepSeek-V3 & R1 合体”,具备根据问题难度自动切换思考形态的能力。通过进行这种思考形态训练,模型在多个“思考”和“非思考”评测榜单上均实现了性能提升,其中在部分代码和数学类的任务上,开启自动思考模式下的模型得分提升高达 20 分左右。官方表示,在部分榜单中,即使模型没有开启思考模式,受益于更优的推理形态,性能也有小幅上涨。o2028资讯网——每日最新资讯28at.com

o2028资讯网——每日最新资讯28at.com

快手技术表示,Kwaipilot 未来将基于 preview 版本模型,进一步增强推理能力,支持更完善的思考中工具使用能力,也会将全部技术细节、训练方法开源。附模型开源地址:o2028资讯网——每日最新资讯28at.com

https://huggingface.co/Kwaipilot/KwaiCoder-AutoThink-previewo2028资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-13494-0.htmlDeepSeek-V3 & R1 合体:快手开源 "Auto Think " 大模型,可根据问题自动调节思考深度

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:Mac 版 ChatGPT 变身生产力神器:AI 录音 + 云文件洞察,打造团队协作最佳助手

下一篇:韩国总统李在明承诺 100 万亿韩元 AI 投资计划,大力扩展基础设施建设

最新热点