面壁智能MiniCPM4:端侧模型极限提速,8B性能超12B竞品引关注
2025-06-09 09:39:16 AI 47观看
摘要在近期举办的2025智源大会上,面壁智能这家北京的大模型创新企业,推出了其开源模型MiniCPM 4.0的两个新版本,分别为0.5B和8B,内部代号“前进四”。这一发布引起了业内广泛关注。据悉,MiniCPM4-0.5B的训练成本仅为Qwen3-0.6B

在近期举办的2025智源大会上,面壁智能这家北京的大模型创新企业,推出了其开源模型MiniCPM 4.0的两个新版本,分别为0.5B和8B,内部代号“前进四”。这一发布引起了业内广泛关注。BWI28资讯网——每日最新资讯28at.com

据悉,MiniCPM4-0.5B的训练成本仅为Qwen3-0.6B的2.7%,却以一半的参数量实现了性能翻倍,综合得分平均分高达52.06分,远超同类模型。更为出色的是,面壁智能还推出了一个0.5B的三级量化版本,平均得分更是达到了56分,这一成绩实属不易。BWI28资讯网——每日最新资讯28at.com

而MiniCPM4-8B的表现同样令人瞩目。其训练开销仅为22%,并加入了长上下文稀疏化版本,使得同等参数下性能更强。在同类端侧模型排行榜中,MiniCPM4-8B的综合得分甚至超越了Gemma3-12B,与Qwen3-8B比肩,位居榜首。BWI28资讯网——每日最新资讯28at.com

面壁智能CEO李大海在会上表示,MiniCPM4模型的最大特点就是速度快。在处理极端场景下的140K上下文时,需要极大的端侧内存。而在Jetson Orin AGX(64G)或RTX 4090(24G)硬件上运行128K长文本时,像Qwen3-8B这样未进行上下文稀疏化的模型,显存往往不够用,需要借助CPU内存,这会导致速度急剧下降。而MiniCPM4-8B则通过快速稀疏化工作,将占用的低长文本缓存降至1/4,在常规场景中至少可以取得3-5倍的速度优势。BWI28资讯网——每日最新资讯28at.com

BWI28资讯网——每日最新资讯28at.com

李大海进一步透露,在显存受限的极限场景中,MiniCPM4的测试数据甚至可以达到220倍的速度提升。面壁智能的MiniCPM4-MCP模型在端侧利用MCP协议,支持15个主流应用,综合评测表现得分颇高。而另一个MiniCPM4-Survey端侧版则可在AI PC上构建深度研究服务,成为离线可用的随身研究报告工具,有助于保护本地隐私数据。BWI28资讯网——每日最新资讯28at.com

BWI28资讯网——每日最新资讯28at.com

值得注意的是,面壁智能与英特尔紧密合作,首次在端侧解锁了128K长上下文窗口。在英特尔平台上,基于InfLLM 2.0稀疏注意力结构,实现了3.8倍加速的推理优化效果。同时,MiniCPM4已经可以在华为昇腾、联发科、高通等主流芯片上流畅运行,并支持vLLM、AutoGPT等推理框架,欧拉版也正在积极适配中。BWI28资讯网——每日最新资讯28at.com

那么,面壁智能是如何实现MiniCPM4又快又好的表现的呢?李大海分享了背后的技术细节。他提到,这是行业首个全开源系统级上下级稀疏化高效创新。MiniCPM4采用了InfLLM 2.0混合稀疏注意力结构,通过分块分区域处理文本,只对最具相关性的重点区域进行注意力计算,从而大大提高了效率。同时,面壁智能还创新地采用了高效的自动双频换挡技术,长文本用稀疏方案,短文本用稠密方案,进一步提升了性能。BWI28资讯网——每日最新资讯28at.com

BWI28资讯网——每日最新资讯28at.com

在推理方面,面壁智能自研了全套端侧高性能推理框架,包括实现稀疏、投机和量化的高效结合的CPM.cu,极致低位宽量化的BitCPM,以及面向多平台端侧芯片极致优化的Arkinfer。这些创新使得MiniCPM4在端侧的表现更加出色。BWI28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
雷军亲证:购买小米YU7,一视同仁需自费
雷军亲证:购买小米YU7,一视同仁需自费
极氪001荣膺中国外观设计金奖,展现中国高端豪华新能源设计魅力
极氪001荣膺中国外观设计金奖,展现中国高端豪华新能源设计魅力
苹果iPhone 17配置大曝光:120Hz屏幕、A18芯片等亮点抢先看
苹果iPhone 17配置大曝光:120Hz屏幕、A18芯片等亮点抢先看
全球首位QQ256级用户诞生,解锁“时光企鹅”等级图标
全球首位QQ256级用户诞生,解锁“时光企鹅”等级图标
东风本田销量断崖式下滑,新能源战略失误成主因?
东风本田销量断崖式下滑,新能源战略失误成主因?
轻型动力新纪元!全国首分钟级超充产业联盟庐江启航
轻型动力新纪元!全国首分钟级超充产业联盟庐江启航
热门内容
  • 荣耀“鲲鹏”照片事件真相大白,造谣者道歉遭刑拘
  • 腾讯阿里AI to C战场“双吴”争霸,谁将问鼎AI搜索之巅?
  • 英伟达全球总部或将落户中国台湾,黄仁勋下周宣布这一重大决定?
  • 教育部新规:学生禁直接复制AI作业,强化独立思考与批判性思维
  • 联发科天玑9400e发布:天玑9300+升级版,蓝牙升级至6.0
  • TIOBE 5月编程语言榜:Python强势领跑,占比创历史新高
  • 中国知网CNKI AI:重塑知识服务新生态,四大核心力引领未来
  • 中国GPU市场竞争激烈,英伟达独占7成,华为昇腾紧追其后!
  • 华为Mate 40系列(5G)已支持5G-A网络,性能再升级!
  • 华为nova 14系列震撼登场!鸿蒙5直板机领衔,nova 14仅售2699元起
  • 教育部新规:中小学分阶段用AI,严禁复制答案强化独立思考
  • 华为nova14 Ultra震撼登场!鸿蒙5系统加持,售价4199元起
  • vivo领跑!2025第18周中国手机份额华为小米紧追其后
  • DeepSeek新论文揭秘:梁文锋领衔探索AI训练推理成本效益之道
  • 华为昇腾超节点技术突破:384卡高速互联,引领AI模型训练新纪元
本栏最新
AI助力高考志愿填报,夸克百度讯飞谁更懂你的心?
AI助力高考志愿填报,夸克百度讯飞谁更懂你的心?
苹果iPadOS 26大改版:新界面、手写笔升级,AI与应用全面进化!
苹果iPadOS 26大改版:新界面、手写笔升级,AI与应用全面进化!
喜临门荣获中国专利优秀奖,智能睡眠技术创新实力获国家级认可
喜临门荣获中国专利优秀奖,智能睡眠技术创新实力获国家级认可
小码王与黑龙江工程学院强强联手,打造信息学创新人才培育新高地
小码王与黑龙江工程学院强强联手,打造信息学创新人才培育新高地
AI争霸赛,谷歌何以从领跑者变追赶者?
AI争霸赛,谷歌何以从领跑者变追赶者?
AI高考作文大比拼:谁才是真正的“状元”之才?
AI高考作文大比拼:谁才是真正的“状元”之才?

本文链接:http://www.28at.com/showinfo-45-13565-0.html面壁智能MiniCPM4:端侧模型极限提速,8B性能超12B竞品引关注

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:大模型高考作文比拼,腾讯垫底百度ChatGPT并列第一,幻觉问题成关键

下一篇:AI助力高考志愿填报,夸克百度讯飞谁更懂你的心?

最新热点