近日,一款名为Kimi-Dev-72B的全新开源代码大模型震撼发布,由神秘团队月之暗面在凌晨悄然推出,专为软件工程任务设计。
这款模型在业界权威的SWE-bench Verified编程基准测试中大放异彩,以仅720亿参数的规模,力压群雄,成绩超越了不久前发布的、参数高达6710亿的新版DeepSeek-R1,树立了开源模型的新标杆。

在SWE-bench Verified测试中,Kimi-Dev-72B取得了高达60.4%的惊人分数,这一成绩不仅彰显了其卓越的软件工程能力,也标志着开源模型在AI辅助编程领域迈出了重要一步。
Kimi-Dev-72B的成功并非偶然。其背后是月之暗面团队通过大规模强化学习进行的精心优化。该模型能够自主修补Docker中的真实存储库,并且只有当整个测试套件通过时才会获得奖励,从而确保了解决方案的正确性和稳健性,符合现实世界的开发标准。
目前,Kimi-Dev-72B已在Hugging Face和GitHub上开放下载和部署。用户不仅可以获取模型权重和源代码,技术报告也将随后推出,为社区提供了宝贵的研究资源。
Kimi-Dev-72B的设计理念和技术细节同样令人瞩目。月之暗面团队巧妙地将BugFixer和TestWriter相结合,形成了独特的双重设计。这一设计使得模型在修复代码错误和编写单元测试方面都能表现出色。同时,通过中期训练和强化学习,Kimi-Dev-72B进一步增强了其编程能力。
在中期训练阶段,月之暗面团队使用了约1500亿个高质量的真实数据,以Qwen 2.5-72B基础模型为起点,精心构建了数据配方,使Kimi-Dev-72B能够学习人类开发者如何推理GitHub问题、编写代码修复和单元测试。这一阶段的训练为后续的强化学习打下了坚实的基础。

而在强化学习阶段,Kimi-Dev-72B则专注于提升其代码编辑能力。月之暗面团队采用了高效的策略优化方法,并重点关注了仅基于结果的奖励、高效的提示集以及正例强化等关键设计。这些设计使得模型在训练过程中能够更有效地利用资源,提升性能。

Kimi-Dev-72B在测试过程中还采用了自我博弈机制。这一机制使得模型能够协调自身Bug修复和测试编写的能力,进一步提升了其整体性能。
举报 0收藏 0打赏 0评论 0分享 0 更多>同类资讯守护代理崛起!Gartner预测2030年将占代理型AI市场10%-15%份额06-17
中兴通讯自智网络白皮书:AI引领高阶自智,探索未来网络新价值在产业数字化浪潮下,运营商加速构建云网算智一体化、高度自动化与智能化的网络体系,自智网络以自动化和智能化为核心特征,成为未来通信网络的内生能力。数字孪生加速网络智能化演进,实现以虚映实、以虚控实,在通信行业…06-17
东方时尚驾校30年蝶变,荣获首批“五星级”认证,新手司机当天自驾回家06-17OpenAI新任高管坦言:公司正处“最大动压”阶段,增长压力空前06-17
蚂蚁集团携手入股灵心巧手,共探灵巧手与云端智能技术新领域06-17
圆通上海新设无人机科技公司,涉足智能机器人研发领域06-17
艾为电子引领散热革新:压电微泵液冷方案,为高性能设备“降温”算力芯片及超轻薄终端的性能瓶颈日益凸显,在狭小的空间内实现高效的散热成为了制约技术进步的关键因素之一,当被动散热架构(如均热板/石墨烯贴片/VC)在应对3.5GHz以上高频运算时,热流密度承载能力已逼近材料物…06-17
慧点科技数智监督治理:重塑企业监督生态,开启高效协同新时代平台融合审计、风险、内控、合规、法务、纪检监察等核心模块,通过大数据、人工智能、大模型等前沿技术,打造“全级次、全链条、智能化、穿透式”的监督体系,全面提升监督效能,为组织高质量发展保驾护航。 慧点科技数智…06-17
台积电2nm芯片良品率突破60%,领跑下一代芯片市场?目前三星虽表示其2nm制程也在逐步提升良率,但短期内仍难以撼动台积电的领先优势。 整体来看,台积电凭借更高的良率、更稳定的制程与强大的客户信任,极可能在2nm世代继续巩固其全球芯片市场的霸主地位,也将进一步拉…06-17Groq联手Hugging Face,AI推理速度升级,能否撼动云服务巨头地位?06-17LinkedIn AI求职搜索革新:自然语言搜索,让求职更懂你06-17LinkedIn上线AI求职搜索,自然语言查询让理想职位触手可及06-17华为“四芯片”封装专利曝光,昇腾910D AI芯片能否弯道超车?06-17科大讯飞融资热度不减,三日累获2.04亿买入,融券净卖出2.7万股6月16日,沪深两融数据显示,科大讯飞获融资买入额0.59亿元,居两市第208位,当日融资偿还额0.64亿元,净卖出474.91万元。 最近三个交易日,12日-16日,科大讯飞分别获融资买入0.43亿元、1.…06-17OpenAI招聘主管详解:公司飞速扩张,人才招募成关键06-17点击查看更多 +全站最新
小米汽车超级工厂:北京汽车产业智能化转型的生动样本
墨西哥科学家研究神秘飞行球体,种种迹象指向“真UFO”?
吉利数字科技公司高层调整,李东辉卸任董事长一职
亿航智能引领载人eVTOL时代,全球首张OC认证开启低空经济新篇章
九三分公司:以“人机物法环”晨思立查,筑安全防线促高质量发展
印度波音客机坠毁百人遇难,美交通部长称无安全问题,真相究竟如何?热门内容
中兴通讯自智网络白皮书:AI引领高阶自智,探索未来网络新价值
东方时尚驾校30年蝶变,荣获首批“五星级”认证,新手司机当天自驾回家
蚂蚁集团携手入股灵心巧手,共探灵巧手与云端智能技术新领域
圆通上海新设无人机科技公司,涉足智能机器人研发领域
艾为电子引领散热革新:压电微泵液冷方案,为高性能设备“降温”
慧点科技数智监督治理:重塑企业监督生态,开启高效协同新时代 
			本文链接:http://www.28at.com/showinfo-45-13852-0.html月之暗面开源新大模型Kimi-Dev-72B,登顶全球软件工程开源模型榜首
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。