微软 Phi-3-vision 基准测试:和 Claude 3-haiku、Gemini 1.0 Pro 相当
2024-05-30 17:11:42 AI 153观看
摘要 5 月 28 日消息,微软在 Build 2024 大会上发布了 Phi-3 家族的最新成员--Phi-3-vision,主打“视觉能力”,能够理解图文内容,同时据称可以在移动平台上流畅高效运行。Phi-3-vision 是一款多模态小型语言模型(SLM),主

5 月 28 日消息,微软在 Build 2024 大会上发布了 Phi-3 家族的最新成员--Phi-3-vision,主打“视觉能力”,能够理解图文内容,同时据称可以在移动平台上流畅高效运行。7hX28资讯网——每日最新资讯28at.com

7hX28资讯网——每日最新资讯28at.com

Phi-3-vision 是一款多模态小型语言模型(SLM),主要用于本地 AI 场景,该模型参数量为 42 亿,上下文长度为 128k token,能够为常规视觉推理任务和其他任务提供支持。7hX28资讯网——每日最新资讯28at.com

那么 Phi-3-vision 有多厉害?微软今天发布了新的论文 [PDF],表示该 SLM 和 Claude 3-haiku、Gemini 1.0 Pro 等其他模型不相上下。7hX28资讯网——每日最新资讯28at.com

7hX28资讯网——每日最新资讯28at.com

微软在论文中对比了 ScienceQA、MathVista 和 ChartQA 等模型,Phi-3-vision 的参数虽然不多,但性能非常优秀。7hX28资讯网——每日最新资讯28at.com

此前报道,微软提供了 Phi-3-vision 相较于字节跳动 Llama3-Llava-Next(8B)、微软研究院和威斯康星大学、哥伦比亚大学合作的 LlaVA-1.6(7B)、阿里巴巴通义千问 QWEN-VL-Chat 模型等竞品模型的比较图表,其中显示 Phi-3-vision 模型在多个项目上表现优异。7hX28资讯网——每日最新资讯28at.com

7hX28资讯网——每日最新资讯28at.com

目前微软已经将该模型上传至 Hugging Face,感兴趣的小伙伴们可以访问项目地址:点此进入。7hX28资讯网——每日最新资讯28at.com

相关阅读:7hX28资讯网——每日最新资讯28at.com

《英特尔力押 SLM 小语言 AI 模型,宣布旗下软硬件已适配微软 Phi-3》7hX28资讯网——每日最新资讯28at.com

《参数量 42 亿,微软公布 SLM 小语言 AI 模型最新成员 Phi-3-vision》7hX28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-4472-0.html微软 Phi-3-vision 基准测试:和 Claude 3-haiku、Gemini 1.0 Pro 相当

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:五粮液浓香酒:劳动节送礼的精致艺术

下一篇:谷歌 CEO 皮查伊:未来几年的 AI 可能会给人一种“具备意识”的假象

最新热点