在人工智能领域的一次重大突破中,MiniMax公司于近日震撼发布了全球首个开源大规模混合架构推理模型——MiniMax-M1。这一发布不仅标志着AI技术的新里程碑,还伴随着一项为期五天的连续更新计划,引起了业界的广泛关注。

MiniMax-M1的参数规模达到了惊人的4560亿,每个token能激活459亿参数,支持长达100万的上下文输入,以及业内最长的8万token推理输出。这一能力不仅与闭源模型巨头谷歌Gemini 2.5 Pro持平,更是DeepSeek-R1的8倍之多。为了满足不同需求,MiniMax还训练了两个版本的M1模型,思考预算分别为40K和80K。
在标准基准测试集上的对比结果显示,MiniMax-M1在复杂的软件工程、工具使用以及长上下文任务方面,均展现出了优于DeepSeek-R1和Qwen3-235B等开源模型的表现。这一成就不仅得益于其庞大的参数规模,更在于其独特的混合架构和高效算法。
在M1的研发过程中,MiniMax团队采用了创新的强化学习方法。据透露,整个强化学习阶段使用了512块H800训练了三周,租赁成本仅为53.74万美金(折合人民币约385.9万元),远低于最初的成本预期。这一高效的成本控制策略,无疑为M1的成功发布奠定了坚实基础。
对于用户而言,MiniMax-M1提供了极大的便利。在MiniMax APP和Web平台上,用户可以不限量免费使用M1。而在API价格方面,MiniMax也提供了多种选择。对于0-32k的输入长度,输入价格为0.8元/百万token,输出价格为8元/百万token;对于32k-128k的输入长度,输入价格为1.2元/百万token,输出价格为16元/百万token;对于128k-1M的输入长度,输入价格为2.4元/百万token,输出价格为24元/百万token。与DeepSeek-R1相比,M1在第三档价格上展现出了绝对优势,因为DeepSeek-R1并不支持如此长的输入长度。
在评测方面,MiniMax-M1在软件工程、长上下文和工具使用等方面的表现尤为突出。在OpenAI发布的MRCR测试集中,M1虽然略逊于Gemini 2.5 Pro,但相比其他模型仍具有明显优势。在评估软件工程能力的SWE-bench Verified测试集中,M1的表现也仅次于DeepSeek-R1-0528。特别是在航空业的TAU-bench(airline)测试集中,M1的表现优于所有其他开源和闭源模型。然而,在数学和编程能力方面,M1的得分相对较低,仍有提升空间。
MiniMax-M1的成功发布,不仅展示了MiniMax在AI技术方面的深厚积累,更为整个行业带来了新的发展机遇。随着AI技术的不断进步和应用场景的不断拓展,MiniMax-M1有望在未来发挥更大的作用,推动人工智能技术的持续创新和发展。
举报 0收藏 0打赏 0评论 0分享 0 更多>同类资讯
月之暗面开源新大模型Kimi-Dev-72B,登顶全球软件工程开源模型榜首月之暗面介绍了Kimi-Dev-72B的设计理念和技术细节,包括BugFixer和TestWriter的组合、中期训练、强化学习和测试时自我博弈。 中期训练充分增强了基础模型对实际Bug修复和单元测试的了…06-17守护代理崛起!Gartner预测2030年将占代理型AI市场10%-15%份额06-17
中兴通讯自智网络白皮书:AI引领高阶自智,探索未来网络新价值在产业数字化浪潮下,运营商加速构建云网算智一体化、高度自动化与智能化的网络体系,自智网络以自动化和智能化为核心特征,成为未来通信网络的内生能力。数字孪生加速网络智能化演进,实现以虚映实、以虚控实,在通信行业…06-17
东方时尚驾校30年蝶变,荣获首批“五星级”认证,新手司机当天自驾回家06-17OpenAI新任高管坦言:公司正处“最大动压”阶段,增长压力空前06-17
蚂蚁集团携手入股灵心巧手,共探灵巧手与云端智能技术新领域06-17
圆通上海新设无人机科技公司,涉足智能机器人研发领域06-17
艾为电子引领散热革新:压电微泵液冷方案,为高性能设备“降温”算力芯片及超轻薄终端的性能瓶颈日益凸显,在狭小的空间内实现高效的散热成为了制约技术进步的关键因素之一,当被动散热架构(如均热板/石墨烯贴片/VC)在应对3.5GHz以上高频运算时,热流密度承载能力已逼近材料物…06-17
慧点科技数智监督治理:重塑企业监督生态,开启高效协同新时代平台融合审计、风险、内控、合规、法务、纪检监察等核心模块,通过大数据、人工智能、大模型等前沿技术,打造“全级次、全链条、智能化、穿透式”的监督体系,全面提升监督效能,为组织高质量发展保驾护航。 慧点科技数智…06-17
台积电2nm芯片良品率突破60%,领跑下一代芯片市场?目前三星虽表示其2nm制程也在逐步提升良率,但短期内仍难以撼动台积电的领先优势。 整体来看,台积电凭借更高的良率、更稳定的制程与强大的客户信任,极可能在2nm世代继续巩固其全球芯片市场的霸主地位,也将进一步拉…06-17Groq联手Hugging Face,AI推理速度升级,能否撼动云服务巨头地位?06-17LinkedIn AI求职搜索革新:自然语言搜索,让求职更懂你06-17LinkedIn上线AI求职搜索,自然语言查询让理想职位触手可及06-17华为“四芯片”封装专利曝光,昇腾910D AI芯片能否弯道超车?06-17科大讯飞融资热度不减,三日累获2.04亿买入,融券净卖出2.7万股6月16日,沪深两融数据显示,科大讯飞获融资买入额0.59亿元,居两市第208位,当日融资偿还额0.64亿元,净卖出474.91万元。 最近三个交易日,12日-16日,科大讯飞分别获融资买入0.43亿元、1.…06-17点击查看更多 +全站最新
小米汽车超级工厂:北京汽车产业智能化转型的生动样本
墨西哥科学家研究神秘飞行球体,种种迹象指向“真UFO”?
吉利数字科技公司高层调整,李东辉卸任董事长一职
亿航智能引领载人eVTOL时代,全球首张OC认证开启低空经济新篇章
九三分公司:以“人机物法环”晨思立查,筑安全防线促高质量发展
印度波音客机坠毁百人遇难,美交通部长称无安全问题,真相究竟如何?热门内容
中兴通讯自智网络白皮书:AI引领高阶自智,探索未来网络新价值
东方时尚驾校30年蝶变,荣获首批“五星级”认证,新手司机当天自驾回家
蚂蚁集团携手入股灵心巧手,共探灵巧手与云端智能技术新领域
圆通上海新设无人机科技公司,涉足智能机器人研发领域
艾为电子引领散热革新:压电微泵液冷方案,为高性能设备“降温”
慧点科技数智监督治理:重塑企业监督生态,开启高效协同新时代
本文链接:http://www.28at.com/showinfo-45-13851-0.htmlMiniMax深夜发布4560亿参数推理模型M1,百万上下文支持,价格亲民
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。