参数破3000亿却性能平庸?大模型的新革命来了!
2024-04-19 09:20:39 AI 115观看
摘要4月17日消息,近日,科技领域对于模型训练的效率和性能展开了新的讨论。这主要源于面壁智能发布的一系列高效、低参数的大模型,这些模型在保持高性能的同时,显著降低了参数规模和训练成本。大约一个月前,马斯克旗下的xAI团队

4月17日消息,近日,科技领域对于模型训练的效率和性能展开了新的讨论。这主要源于面壁智能发布的一系列高效、低参数的大模型,这些模型在保持高性能的同时,显著降低了参数规模和训练成本。sVf28资讯网——每日最新资讯28at.com

大约一个月前,马斯克旗下的xAI团队开源了名为Grok-1的巨型MoE模型,其参数量高达3140亿,被誉为“庞然大物”。然而,令人惊讶的是,尽管Grok-1在参数规模上占据优势,但其性能表现却仅与MistralAI的8x7B MoE模型相当。这一现象引发了业内对于“参数数量与模型性能”关系的深入反思。sVf28资讯网——每日最新资讯28at.com

sVf28资讯网——每日最新资讯28at.com

在此背景下,面壁智能的最新研究成果显得格外引人注目。据悉,面壁智能自2020年开始训练大模型以来,便始终致力于提升模型训练的效率。他们坚信,“让每一个参数发挥最大的作用”,在同等参数量上实现更好的性能,才是解决大模型“高效”训练的核心。sVf28资讯网——每日最新资讯28at.com

今年2月,面壁智能发布了MiniCPM2B模型,该模型在较小的参数量基础上实现了与Mistral-7B相当的性能,验证了其“低参数、高性能”的方法论。更重要的是,面壁智能通过这一系列研究,成功降低了千亿大模型的训练成本。sVf28资讯网——每日最新资讯28at.com

4月11日,面壁智能又推出了新一代端侧旗舰大模型系列,包括显著增强OCR能力的2.8B多模态模型MiniCPM-V2.0、仅1.2B却强过llama2-13B的MiniCPM-1.2B模型等。这些模型的推出进一步证明了面壁智能在高效训练大模型方面的实力。sVf28资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,面壁智能之所以能够在模型训练效率和性能上取得显著成果,得益于他们独特的“高效训练”理念以及在小模型上的深入探索。通过小模型验证大模型的训练投入产出比,面壁智能走出了一条独特的研发路线。这不仅使他们在资源有限的情况下实现了模型的高效训练,还为未来实现通用人工智能(AGI)奠定了坚实的基础。sVf28资讯网——每日最新资讯28at.com

近日,面壁智能也完成了新一轮数亿元融资,这将为他们未来的研发工作提供更多的资金支持。在追求高效训练的道路上,面壁智能正不断取得新的突破,为大模型领域的发展注入了新的活力。sVf28资讯网——每日最新资讯28at.com

标签:ScalingLaw
举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
2024年高性价比家用激光投影怎么选?当贝X5 Pro目前家用最好的4K投影
2024年高性价比家用激光投影怎么选?当贝X5 Pro目前家用最好的4K投影
卓威科技:女性支撑的消费市场
卓威科技:女性支撑的消费市场
自带AI按钮,罗技Signature AI Edition M750鼠标全新发布
自带AI按钮,罗技Signature AI Edition M750鼠标全新发布
特斯拉上海储能工厂下月动工,预计明年初实现大规模生产
特斯拉上海储能工厂下月动工,预计明年初实现大规模生产
“变形金刚”定制版布加迪Veyron GS Vitesse将亮相拍卖场,全球仅此一辆!
“变形金刚”定制版布加迪Veyron GS Vitesse将亮相拍卖场,全球仅此一辆!
丰田积极调整电动车策略,计划推出纯电版汉兰达
丰田积极调整电动车策略,计划推出纯电版汉兰达
热门内容
  • 华为云携手乐聚机器人,共探“盘古大模型+夸父人形机器人”新应用场景
  • 谷歌发布CodeGemma AI模型,打造顶级代码辅助利器
  • 华为云携手贵安新区,共筑全球领先智算高地
  • 谷歌借助AI突破:提前7天预测洪灾,全球80国将受益
  • 音乐界的ChatGPT?天工SkyMusic邀您体验AI音乐创作
  • 马斯克旗下xAI发布创新模型Grok-1.5V 实现流程图到Python代码的转换
  • 谷歌AI应用 Google Vids亮相:PPT技能通用,视频制作与多人协作一站式搞定
  • WPS推出AI会员服务,月费25元起,开启AI办公新纪元
  • 微软或与OpenAI联手,斥资千亿美元打造“星际之门”AI超算
  • 英美联手打造AI安全新标杆,科学合作伙伴关系正式建立
  • AI新势力Kimi挑战百度霸权,阿里成背后金主
  • 百度不开源文心一言,为何还自信能领先?
  • 百度文心一言推出新功能,秒速定制你的专属AI声音
  • 人工智能音乐大杀器!「天工SkyMusic」你敢试吗?
  • 马斯克再谈AI风险:利大于弊仍值得冒险
本栏最新
英特尔借助AI技术,大幅缩短酷睿Ultra处理器设计周期
英特尔借助AI技术,大幅缩短酷睿Ultra处理器设计周期
蚂蚁、谷歌等联手出击,AI安全有了新保障?!
蚂蚁、谷歌等联手出击,AI安全有了新保障?!
亚马逊Amazon Music推出AI智能歌单功能“Maestro”测试版
亚马逊Amazon Music推出AI智能歌单功能“Maestro”测试版
OpenAI CEO与COO共话未来:AI成本大降,普及时代或将到来
OpenAI CEO与COO共话未来:AI成本大降,普及时代或将到来
苹果iOS 18将引领AI革命?全新功能曝光!
苹果iOS 18将引领AI革命?全新功能曝光!
百度创始人再放话:开源模型将落后?!
百度创始人再放话:开源模型将落后?!

本文链接:http://www.28at.com/showinfo-45-5186-0.html参数破3000亿却性能平庸?大模型的新革命来了!

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:Sam Altman爆料:OpenAI的下一步将震惊世界!

下一篇:AI评标师来了,国能集团每年省5400亿!

最新热点