微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型:10 倍吞吐量,推理能力升级
2025-07-14 10:38:59 AI 7观看
摘要 7 月 11 日消息,科技媒体 NeoWin 昨日(7 月 10 日)发布博文,报道称微软推出 Phi-4-mini-flash-reasoning 小语言模型,重点提升端侧 AI 模型的数学和逻辑推理能力。Phi-4-mini-flash-reasoning 的主要优势在于,它能

7 月 11 日消息,科技媒体 NeoWin 昨日(7 月 10 日)发布博文,报道称微软推出 Phi-4-mini-flash-reasoning 小语言模型,重点提升端侧 AI 模型的数学和逻辑推理能力。Dnx28资讯网——每日最新资讯28at.com

Phi-4-mini-flash-reasoning 的主要优势在于,它能够在边缘设备、移动应用和嵌入式系统等资源不足的场景下,引入先进的推理功能。Dnx28资讯网——每日最新资讯28at.com

Dnx28资讯网——每日最新资讯28at.com

在架构方面,Phi-4-mini-flash-reasoning 创新引入了 SambaY 架构,而该架构的一大亮点,就是名为 Gated Memory Unit(GMU)的组件,它能够高效地在模型的内部之间共享信息,从而提高模型的效率。Dnx28资讯网——每日最新资讯28at.com

这些改进让模型能够更快地生成答案和完成任务,即使面对非常长的输入也能应对自如,Phi 模型还能处理大量数据,理解非常长的文本或对话。Dnx28资讯网——每日最新资讯28at.com

Dnx28资讯网——每日最新资讯28at.com

在性能方面,相比较其它 Phi 模型,Phi-4-mini-flash-reasoning 的吞吐量最高提升 10 倍,这意味着在给定的时间内,Phi-4-mini-flash-reasoning 可以完成更多的工作。Dnx28资讯网——每日最新资讯28at.com

它可以在相同的时间内处理 10 倍多的请求或生成 10 倍多的文本,这对于实际应用来说是一个巨大的改进,此外,延迟也降低至其它 Phi 模型的 1/2~1/3。附上相关性能数据如下:Dnx28资讯网——每日最新资讯28at.com

Dnx28资讯网——每日最新资讯28at.com

Dnx28资讯网——每日最新资讯28at.com

Dnx28资讯网——每日最新资讯28at.com

Phi-4-mini-flash-reasoning 新型模型已在 Azure AI Foundry、NVIDIA API Catalog 和 Hugging Face 上线。Dnx28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-14495-0.html微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型:10 倍吞吐量,推理能力升级

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:全球首款棉花激光打顶机器人亮相:准确率达 98.9%,作业效率 10 倍于人工

下一篇:欧盟公布最终版《通用人工智能行为准则》,8 月 2 日起正式实施

最新热点