近期,AI领域迎来了一项重大突破,月之暗面团队正式推出了其最新研发的开源代码大模型——Kimi-Dev-72B。这款模型在软件工程基准测试SWE-bench Verified中取得了令人瞩目的成绩,以60.4%的准确率刷新了全球开源模型的最高纪录。
据了解,Kimi-Dev-72B是专为软件工程任务量身打造的,尽管其参数量仅为720亿,但在SWE-bench Verified测试中,却成功超越了近期发布的DeepSeek-R1-0528模型。后者虽然拥有高达6710亿的参数量,但在此次测试中仅以57.6%的准确率落后于Kimi-Dev-72B。

Kimi-Dev-72B之所以能够在测试中脱颖而出,得益于其采用的大规模强化学习训练方法。该模型能够在真实的代码环境中自动修复Docker存储库,并且只有在完整测试套件通过后才给予奖励。这种训练方式极大地提升了模型输出的正确性和鲁棒性,使其更加贴合实际的软件开发标准。
Kimi-Dev-72B的模型权重和源代码已经全面开源,并在Hugging Face与GitHub平台上向开发者社区开放下载和部署。这一举措无疑将极大地推动软件工程领域的发展,为开发者们提供更加高效、智能的工具。
举报 0收藏 0打赏 0评论 0分享 0 更多>同类资讯OpenAI与微软关系紧张,奥特曼或采取极端措施保住200亿融资?06-17iOS 18.6开发者预览版来了,国行iPhone AI功能何时上线仍是谜06-17
百度Apollo捐自动驾驶车辆助北工商科研,未来高校自动驾驶教育迎新机遇?06-17夸克App新升级:“夸克老师”上线,AI个性化辅导助力学子成长06-17
AI硬件融入生活,火山引擎引领智能化新浪潮火山引擎在其智能硬件解决方案中反复强调的「原子化能力」和「端云一体化」理念,恰恰也切中了当前 IoT 设备AI化进程中的核心症结——如何打破端与云之间的壁垒,让 AI 能力更顺畅地流淌到每一个硬件终端。 …06-17
MiniMax深夜发布4560亿参数推理模型M1,百万上下文支持,价格亲民MiniMax在标准基准测试集上的对比显示,在复杂的软件工程、工具使用和长上下文任务方面,MiniMax-M1优于DeepSeek-R1和Qwen3-235B等开源模型。 在评估软件工程能力的测试集SWE-…06-17
月之暗面开源新大模型Kimi-Dev-72B,登顶全球软件工程开源模型榜首月之暗面介绍了Kimi-Dev-72B的设计理念和技术细节,包括BugFixer和TestWriter的组合、中期训练、强化学习和测试时自我博弈。 中期训练充分增强了基础模型对实际Bug修复和单元测试的了…06-17守护代理崛起!Gartner预测2030年将占代理型AI市场10%-15%份额06-17
中兴通讯自智网络白皮书:AI引领高阶自智,探索未来网络新价值在产业数字化浪潮下,运营商加速构建云网算智一体化、高度自动化与智能化的网络体系,自智网络以自动化和智能化为核心特征,成为未来通信网络的内生能力。数字孪生加速网络智能化演进,实现以虚映实、以虚控实,在通信行业…06-17
东方时尚驾校30年蝶变,荣获首批“五星级”认证,新手司机当天自驾回家06-17OpenAI新任高管坦言:公司正处“最大动压”阶段,增长压力空前06-17
蚂蚁集团携手入股灵心巧手,共探灵巧手与云端智能技术新领域06-17
圆通上海新设无人机科技公司,涉足智能机器人研发领域06-17
艾为电子引领散热革新:压电微泵液冷方案,为高性能设备“降温”算力芯片及超轻薄终端的性能瓶颈日益凸显,在狭小的空间内实现高效的散热成为了制约技术进步的关键因素之一,当被动散热架构(如均热板/石墨烯贴片/VC)在应对3.5GHz以上高频运算时,热流密度承载能力已逼近材料物…06-17
慧点科技数智监督治理:重塑企业监督生态,开启高效协同新时代平台融合审计、风险、内控、合规、法务、纪检监察等核心模块,通过大数据、人工智能、大模型等前沿技术,打造“全级次、全链条、智能化、穿透式”的监督体系,全面提升监督效能,为组织高质量发展保驾护航。 慧点科技数智…06-17点击查看更多 +全站最新
Fortinet Accelerate 2025上海站落幕,AI安全新时代如何共筑?
亿航智能引领!全球首张载人无人机运营证颁发,载人飞行时代正式启航
吉利银河翼真L380广州测评:豪华纯电MPV新标杆,空间表现超越同级?
固态电池竞赛加速,中国车企能否守住市场领先地位?
宝马中国:100%退役动力电池回收,打造绿色供应链新典范
小米汽车上周交付量出炉,SU7系列热销,YU7预生产规模庞大即将发布!热门内容
百度Apollo捐自动驾驶车辆助北工商科研,未来高校自动驾驶教育迎新机遇?
AI硬件融入生活,火山引擎引领智能化新浪潮
MiniMax深夜发布4560亿参数推理模型M1,百万上下文支持,价格亲民
月之暗面开源新大模型Kimi-Dev-72B,登顶全球软件工程开源模型榜首
中兴通讯自智网络白皮书:AI引领高阶自智,探索未来网络新价值
东方时尚驾校30年蝶变,荣获首批“五星级”认证,新手司机当天自驾回家 
			本文链接:http://www.28at.com/showinfo-45-13845-0.html月之暗面Kimi-Dev-72B开源,刷新全球AI软件工程基准测试成绩!
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。