百度近日宣布了一项重大举措,正式对外开源了其文心大模型4.5系列,这一系列涵盖了多达10款模型,包括拥有47B和3B激活参数的混合专家(MoE)模型,以及一款0.3B参数的稠密型模型。尤为百度不仅开放了预训练权重,还一并公开了推理代码,实现了真正的全面开源。
目前,开发者已经可以在飞桨星河社区、HuggingFace等多个平台上下载并部署文心大模型4.5系列。同时,百度智能云千帆大模型平台也提供了开源模型的API服务,进一步降低了使用门槛。
百度此次开源的10款模型,在多个关键维度上均展现出了行业领先地位。无论是独立自研的模型数量,还是模型类型的多样性、参数的丰富程度,乃至开源的宽松度和可靠性,百度都表现出了强大的竞争力。
文心大模型4.5系列在MoE架构上进行了创新,提出了一种全新的多模态异构模型结构。这种结构不仅适用于从大语言模型向多模态模型的持续预训练,而且在保持或提升文本任务性能的同时,显著增强了多模态理解能力。这一突破主要得益于多模态混合专家模型预训练、高效训练推理框架以及针对模态的后训练等关键技术。
所有文心大模型4.5系列均基于飞桨深度学习框架进行训练、推理和部署,实现了高效的资源利用。在大语言模型的预训练中,模型的FLOPs利用率高达47%,彰显了飞桨框架的强大性能。
实验数据表明,文心大模型4.5系列在多个文本和多模态基准测试中均达到了业界领先水平。特别是在指令遵循、世界知识记忆、视觉理解和多模态推理等任务上,其表现尤为突出。
在文本模型方面,文心大模型4.5系列展现出了强大的基础能力、高事实准确性、出色的指令遵循能力以及卓越的推理和编程能力。在多个主流基准评测中,它甚至超越了DeepSeek-V3、Qwen3等模型,彰显了其强大的竞争力。
而在多模态模型领域,文心大模型4.5系列同样表现出色。它拥有卓越的视觉感知能力和丰富的视觉常识,实现了思考与非思考的统一。在视觉常识、多模态推理、视觉感知等主流评测中,它的表现优于闭源的OpenAI o1模型。
文心大模型4.5系列在轻量模型上也取得了显著成果。例如,文心4.5-21B-A3B-Base文本模型的效果与同量级的Qwen3相当,而文心4.5-VL-28B-A3B多模态模型则是目前同量级中最好的多模态开源模型,其性能甚至与更大参数的Qwen2.5-VL-32B模型不相上下。
文心大模型4.5系列的权重按照Apache 2.0协议进行开源,这为学术研究和产业应用提供了极大的便利。同时,基于飞桨提供的开源产业级开发套件,这些模型可以广泛兼容多种芯片,进一步降低了模型的后训练和部署门槛。
作为国内AI研发的先行者之一,百度在算力、框架、模型到应用的全链条布局上构建了显著的AI全栈技术优势。飞桨作为中国首个自主研发、功能丰富、开源开放的产业级深度学习平台,经过多年的积累,已经形成了完善的开源技术与生态系统。
此次文心大模型4.5系列的开源发布,还同步升级了文心大模型开发套件ERNIEKit和大模型高效部署套件FastDeploy。这些工具为文心大模型4.5系列及开发者提供了开箱即用的便捷体验和全流程支持,进一步推动了AI技术的普及和应用。
举报 0收藏 0打赏 0评论 0分享 0 更多>同类资讯魔搭社区:汇聚7万模型,赋能1600万开发者,打造中国AI开源新生态06-30全球首发!国家能源集团“擎源”大模型引领发电行业智能新篇章06-30AI搜索时代:大语言模型偏好与传统SEO策略不谋而合06-30中国海洋科技新突破:OceanGPT(沧渊)大模型正式发布06-30华为重磅开源:盘古7B稠密与72B混合专家大模型,共筑AI生态新篇章06-30ChatGPT引导心理困扰用户求助记者,探讨AI与心理健康互动新议题06-30百度文心大模型系列最新成果亮相飞桨平台,开源多款高性能模型06-30OpenAI高管怒批Meta挖角:比作家中遭窃,呼吁员工坚守岗位严拒诱惑06-30英伟达高层集体套现超十亿,股价却持续高涨引关注06-30OpenAI租用Google TPU,或撼动英伟达AI芯片市场地位06-30MOKI AI工具上线:图片秒变专业视频,创意广告模板限时免费用06-30OpenAI首席执行官提醒:ChatGPT虽火,但用户需谨慎对待人工智能风险06-30OpenAI CEO提醒:人工智能非万能,用户需谨慎使用ChatGPT06-30本文链接:http://www.28at.com/showinfo-45-14286-0.html百度文心大模型4.5系列全面开源:10款模型引领AI技术创新
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。