“端侧 ChatGPT 时刻到来”,面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型
2024-09-09 16:33:14 AI 62观看
摘要 9 月 6 日消息,面壁智能官方公众号昨日(9 月 5 日)发布博文,宣布推出开源 MiniCPM3-4B AI 模型,声称“端侧 ChatGPT 时刻到来”。附上 MiniCPM 3.0开源地址:https://github.com/OpenBMB/MiniCPMhttps://huggingface

9 月 6 日消息,面壁智能官方公众号昨日(9 月 5 日)发布博文,宣布推出开源 MiniCPM3-4B AI 模型,声称“端侧 ChatGPT 时刻到来”。h0l28资讯网——每日最新资讯28at.com

附上 MiniCPM 3.0开源地址:h0l28资讯网——每日最新资讯28at.com

https://github.com/OpenBMB/MiniCPMh0l28资讯网——每日最新资讯28at.com

https://huggingface.co/openbmb/MiniCPM3-4Bh0l28资讯网——每日最新资讯28at.com

MiniCPM3-4B 是 MiniCPM 系列的第三代产品,整体性能超过了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,媲美多款 70 亿~90 亿参数的 AI 模型。h0l28资讯网——每日最新资讯28at.com

h0l28资讯网——每日最新资讯28at.com

相比 MiniCPM1.0 / MiniCPM2.0,MiniCPM3-4B 拥有更强大、更多用途的技能集,可用于更广泛的用途。MiniCPM3-4B 支持函数调用和代码解释器。h0l28资讯网——每日最新资讯28at.com

h0l28资讯网——每日最新资讯28at.com

下面是 3 个版本的模型结构(1->2->3)的区别:h0l28资讯网——每日最新资讯28at.com

词表大小:123K->73K->73Kh0l28资讯网——每日最新资讯28at.com

模型层数:40->52->62h0l28资讯网——每日最新资讯28at.com

隐藏层节点:2304->1536->2560h0l28资讯网——每日最新资讯28at.com

最大长度:4k->4K->32kh0l28资讯网——每日最新资讯28at.com

系统提示词:不支持->不支持->支持h0l28资讯网——每日最新资讯28at.com

工具调用和代码解释器:不支持->不支持->支持h0l28资讯网——每日最新资讯28at.com

MiniCPM3-4B 有一个 32k 上下文窗口。MiniCPM3-4B 借助 LLMxMapReduce,不需要占用太高的内存,可以处理理论上的无限上下文。h0l28资讯网——每日最新资讯28at.com

h0l28资讯网——每日最新资讯28at.com

面壁智能还发布了 RAG 套件 MiniCPM-Embedding 模型和 MiniCPM-Reranker 模型,针对 RAG 场景还发布了微调版 MiniCPM3-RAG-LoRA 模型。h0l28资讯网——每日最新资讯28at.com

h0l28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-6871-0.html“端侧 ChatGPT 时刻到来”,面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:谷歌 Google Photos 美国获推“询问照片内容”测试功能:基于 Gemini AI 模型、支持自然语言

下一篇:瑞典支付巨头 Klarna 裁员 1000 人后「广进」10 亿扭亏为盈,AI 接管客服效率提升八成

最新热点