智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”
2025-08-13 16:54:30 AI 36观看
摘要 8 月 11 日消息,智谱 AI 今日推出全球 100B 级效果最佳的开源视觉推理模型 GLM-4.5V(总参数 106B,激活参数 12B),并同步在魔搭社区与 Hugging Face 开源。此外,API 调用价格低至输入 2 元 / M tokens,输出 6 元 / M

8 月 11 日消息,智谱 AI 今日推出全球 100B 级效果最佳的开源视觉推理模型 GLM-4.5V(总参数 106B,激活参数 12B),并同步在魔搭社区与 Hugging Face 开源。此外,API 调用价格低至输入 2 元 / M tokens,输出 6 元 / M tokens。QNK28资讯网——每日最新资讯28at.com

QNK28资讯网——每日最新资讯28at.com

从官方介绍获悉,GLM-4.5V 基于智谱新一代旗舰文本基座模型 GLM-4.5-Air,延续 GLM-4.1V-Thinking 技术路线,在 41 个公开视觉多模态榜单中综合效果达到同级别开源模型 SOTA 性能,涵盖图像、视频、文档理解以及 GUI Agent 等常见任务。QNK28资讯网——每日最新资讯28at.com

QNK28资讯网——每日最新资讯28at.com

在多模态榜单之外,其更重视模型在真实场景下的表现与可用性。GLM-4.5V 通过高效混合训练,具备覆盖不同种视觉内容的处理能力,实现全场景视觉推理,包括:QNK28资讯网——每日最新资讯28at.com

图像推理(场景理解、复杂多图分析、位置识别)QNK28资讯网——每日最新资讯28at.com

视频理解(长视频分镜分析、事件识别)QNK28资讯网——每日最新资讯28at.com

GUI 任务(屏幕读取、图标识别、桌面操作辅助)QNK28资讯网——每日最新资讯28at.com

复杂图表与长文档解析(研报分析、信息提取)QNK28资讯网——每日最新资讯28at.com

Grounding 能力(精准定位视觉元素)QNK28资讯网——每日最新资讯28at.com

QNK28资讯网——每日最新资讯28at.com

同时,模型新增“思考模式”开关,用户可灵活选择快速响应或深度推理,平衡效率与效果。为帮助开发者直观体验 GLM-4.5V 的模型能力,打造专属于自己的多模态应用,智谱 AI 同步开源了一款桌面助手应用。QNK28资讯网——每日最新资讯28at.com

该桌面应用可实时截屏、录屏获取屏幕信息,并依托 GLM-4.5V 处理多种视觉推理任务,日常处理如代码辅助、视频内容分析、游戏解答、文档解读等多类视觉任务,成为一个能看着屏幕和你一起工作娱乐的伙伴。我们也希望通过模型开源和 API 服务,赋能更多有想法的开发者,基于多模态基座模型发挥创意和想象,把过去科幻电影中的场景变为现实。QNK28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-26079-0.html智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:高通:OpenAI 最小开源模型 gpt-oss-20b 可在骁龙终端运行

下一篇:通用人工智能成资本炒作工具:OpenAI 奥尔特曼称 AI 演进应分级讨论

最新热点