Meta发布Llama 4系列AI,混合专家架构能否助其效率飙升?
2025-04-06 08:34:58 资讯 65观看
摘要meta近期推出了其最新的Llama 4系列AI模型,这一系列包括了Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth三款模型。据meta透露,这些模型均经过了庞大的未标注文本、图像和视频数据的训练,旨在赋予它们广泛的视觉理

meta近期推出了其最新的Llama 4系列AI模型,这一系列包括了Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth三款模型。据meta透露,这些模型均经过了庞大的未标注文本、图像和视频数据的训练,旨在赋予它们广泛的视觉理解能力。0FP28资讯网——每日最新资讯28at.com

目前,meta已将Scout和Maverick两款模型上架至Hugging Face平台。而Behemoth模型仍在紧锣密鼓的训练中。Scout模型能够在单个英伟达H100 GPU上运行,而Maverick则需要更高配置的英伟达H100 DGX AI平台或性能相当的设备。0FP28资讯网——每日最新资讯28at.com

值得注意的是,Llama 4系列是meta首次采用混合专家(MoE)架构的模型。这种架构通过将数据处理任务分解为多个子任务,再将这些子任务分配给更小的、专门化的“专家”模型,从而在训练和回答用户查询时展现出更高的效率。例如,Maverick模型拥有4000亿个参数,但在128个“专家”模型中,只有170亿个参数处于活跃状态。0FP28资讯网——每日最新资讯28at.com

0FP28资讯网——每日最新资讯28at.com

相比之下,Scout模型拥有170亿个活跃参数,分布在16个“专家”模型中,总参数数为1090亿个。尽管Llama 4系列模型在性能上有所提升,但它们并非像OpenAI的o1和o3-mini那样的“推理模型”。推理模型会对答案进行事实核查,通常能更可靠地回答问题,但响应时间相对较长。0FP28资讯网——每日最新资讯28at.com

meta内部测试显示,Maverick模型在通用AI助手和聊天等应用场景中表现出色,尤其在创意写作、代码生成、翻译、推理、长文本上下文总结和图像基准测试等方面,其性能超过了OpenAI的GPT-4和谷歌的Gemini 2.0等模型。然而,与谷歌的Gemini 2.5 Pro、Anthropic的Claude 3.7 Sonnet和OpenAI的GPT-4.5等更强大的最新模型相比,Maverick仍有一定的提升空间。0FP28资讯网——每日最新资讯28at.com

0FP28资讯网——每日最新资讯28at.com

Scout模型则擅长总结文档和基于大型代码库进行推理。该模型支持处理1000万个词元,这意味着它一次能够处理数百万字的文本。meta还预告了其Behemoth模型。据透露,Behemoth拥有2880亿个活跃参数,分布在16个“专家”模型中,总参数数接近2万亿个。meta内部基准测试显示,在一些衡量解决数学问题等科学、技术、工程和数学(STEM)技能的评估中,Behemoth的表现优于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro,但略逊于Gemini 2.5 Pro。0FP28资讯网——每日最新资讯28at.com

0FP28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0  更多>同类资讯NAS使用需谨慎:RAID0无备份不备电,数据丢失风险大!04-06川崎重工四足机器人CORLEO亮相:氢燃料电池驱动,越野性能卓越04-06小米SU7事故警醒,多地高速频现“智驾慎用”警示牌04-06我国首台智能红外融冰设备试运成功!风机叶片20秒速“解冻”04-06适马或将发布200mm f/1.8全画幅镜头,索尼E和徕卡L卡口适用?04-06经典落幕!佳能EF 50mm F1.4 USM单反镜头宣布停产04-05智驾营销迷雾背后:年轻生命逝去的警钟,车企责任何在?04-05中油工程突破!国内首套CCUS-EGR碳捕集装置调试合格04-05《超人》新片超长预览曝光!2025年7月北美震撼来袭04-05清明小长假首日,全国铁路单日旅客发送量突破2000万人次!04-05国产GTC-80ⅡJ探伤车亮相,精准至毫米,铁路检测不再依赖进口!04-05"春日“打鸟”热,京东直播教你如何捕捉飞鸟灵动瞬间!"04-05双登集团转战港股:年收45亿利润3.5亿,估值近50亿能否成功上市?04-05多地高速频现警示:智能辅助驾驶,慎用为妙!04-05Win11 24H2遇sprotect.sys驱动问题,微软暂停部分设备更新04-05点击查看更多 +全站最新小米SU7事件后,燃油车安全性再获关注,你的购车选择会变吗?小米SU7事件后,燃油车安全性再获关注,你的购车选择会变吗?日产2029年全固态电池计划:电动车与混动技术革新在即日产2029年全固态电池计划:电动车与混动技术革新在即本田全新电动SUV量产版谍照出炉,个性外观延续,2026年即将上市!本田全新电动SUV量产版谍照出炉,个性外观延续,2026年即将上市!比亚迪全新跑车内饰抢先看!2025上海车展即将震撼登场比亚迪全新跑车内饰抢先看!2025上海车展即将震撼登场电动车风靡城市,安全隐患与管理难题下,共享电动车何去何从?电动车风靡城市,安全隐患与管理难题下,共享电动车何去何从?2025上海车展前瞻:六款热门SUV,哪款将成新能源市场新宠?2025上海车展前瞻:六款热门SUV,哪款将成新能源市场新宠?热门内容
  • 美团入局AI新赛道,硅基流动完成新一轮融资引关注
  • 刘强东自豪宣布:京东快递小哥退休金超五千,公积金数十万!
  • 字节AI编程神器Trae牵手硅基流动,打造高效编码新体验
  • 无人机滥用致东方白鹳死亡,保护野生动物摄影需有底线!
  • 汉川童车火遍全球!外媒聚焦:中国制造,处处有惊喜
  • 《哪吒之魔童闹海》4月登陆日本,全球票房破147亿紧追《复联》
  • 莲花味精“破产”谣言不攻自破,公司火爆回应:我们挺好的!
  • 《哪吒2》票房高歌猛进,全球动画电影榜直逼《复联3》!
  • 网红滕顺强夫妇遭质疑后宣布退网,商场回应:消杀为常规流程
  • 胖东来于东来打断永辉高管:月赚200万门店为何不先涨工资?
  • 小米SU7事故后,遇难者家属删博引猜测,与小米会面后真相何在?
  • 某车企裁员风波再起,比例高达三成?真相尚待揭晓
  • SpaceX创历史:载人航天器首飞极地轨道,太空种植蘑菇实验引期待
  • 预包装食品禁用“零添加”等宣传语,如何科学选食成新课题!
  • 华为内部通报舞弊案:成都研究所多人被辞,任正非封楼抓人系谣言
本栏最新NAS使用需谨慎:RAID0无备份不备电,数据丢失风险大!NAS使用需谨慎:RAID0无备份不备电,数据丢失风险大!川崎重工四足机器人CORLEO亮相:氢燃料电池驱动,越野性能卓越川崎重工四足机器人CORLEO亮相:氢燃料电池驱动,越野性能卓越小米SU7事故警醒,多地高速频现“智驾慎用”警示牌小米SU7事故警醒,多地高速频现“智驾慎用”警示牌我国首台智能红外融冰设备试运成功!风机叶片20秒速“解冻”我国首台智能红外融冰设备试运成功!风机叶片20秒速“解冻”适马或将发布200mm f/1.8全画幅镜头,索尼E和徕卡L卡口适用?适马或将发布200mm f/1.8全画幅镜头,索尼E和徕卡L卡口适用?经典落幕!佳能EF 50mm F1.4 USM单反镜头宣布停产经典落幕!佳能EF 50mm F1.4 USM单反镜头宣布停产

本文链接:http://www.28at.com/showinfo-16-141489-0.htmlMeta发布Llama 4系列AI,混合专家架构能否助其效率飙升?

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:超人归来!DC全新电影超前预览曝光,7月北美上映引期待

下一篇:NAS使用需谨慎:RAID0无备份不备电,数据丢失风险大!

最新热点