智谱AI新突破:CogView4文生图模型,首个开源支持汉字生成达SOTA
2025-03-04 15:06:22 AI 75观看
摘要智谱AI最新发布的CogView4模型在文本到图像生成领域取得了突破性进展,成为首个能够生成汉字的开源模型,并在DPG-Bench基准测试中荣获榜首,标志着开源文生图模型的新高度。这一创新成果不仅遵循Apache 2.0协议,更为图像生

智谱AI最新发布的CogView4模型在文本到图像生成领域取得了突破性进展,成为首个能够生成汉字的开源模型,并在DPG-Bench基准测试中荣获榜首,标志着开源文生图模型的新高度。这一创新成果不仅遵循Apache 2.0协议,更为图像生成领域带来了前所未有的技术革新。TPq28资讯网——每日最新资讯28at.com

据悉,CogView4模型以其卓越的复杂语义对齐和指令跟随能力,能够支持中英双语输入,无论文本长度如何,均能生成指定范围内的任意分辨率图像。这一特性使得CogView4在广告、短视频等创意领域具有广泛的应用潜力。TPq28资讯网——每日最新资讯28at.com

在DPG-Bench基准测试中,CogView4凭借其出色的表现脱颖而出,成为开源文生图模型中的佼佼者。DPG-Bench测试主要评估模型在复杂语义对齐和指令跟随方面的能力,而CogView4无疑在这一领域树立了新的标杆。TPq28资讯网——每日最新资讯28at.com

TPq28资讯网——每日最新资讯28at.com

CogView4的两大技术性创新尤为引人注目。首先,它支持中英双语提示词输入,擅长理解和遵循中文提示词,这在开源文生图模型中尚属首次。通过采用具备双语能力的GLM-4 encoder,并结合中英双语图文对进行训练,CogView4成功实现了双语提示词输入功能。这一创新使得模型能够更好地满足中文用户的创意需求,如古诗文中的意境描绘等。TPq28资讯网——每日最新资讯28at.com

TPq28资讯网——每日最新资讯28at.com

其次,CogView4支持输入任意长度的提示词,并能够生成指定范围内的任意分辨率图像。这一特性极大地提升了用户创作的自由度,同时也提高了训练效率。为了实现这一目标,CogView4采用了二维旋转位置编码(2D RoPE)来建模图像位置信息,并通过内插位置编码方式支持不同分辨率的图像生成任务。模型还采用了Flow-matching方案进行扩散生成建模,并结合参数化的线性动态噪声规划,以适应不同分辨率图像的信噪比需求。TPq28资讯网——每日最新资讯28at.com

TPq28资讯网——每日最新资讯28at.com

作为首个遵循Apache 2.0协议的图像生成模型,CogView4的开源将极大地推动AI技术的普及和应用。智谱AI表示,将继续增加ControlNet、ComfyUI等生态支持,并推出全套的微调工具包,以满足更多用户的需求。CogView4的最新版本将于3月13日上线智谱清言平台,供用户下载和使用。TPq28资讯网——每日最新资讯28at.com

作为国内最早的开源大模型公司之一,智谱AI始终致力于推动AI技术的普惠发展。2025年被定为智谱开源年,公司将陆续开源基础模型、推理模型、多模态模型、Agent模型等,为AI技术的创新和应用注入新的活力。TPq28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
AMD下代APU性能大爆发,游戏表现能否真超RTX 5070 Ti?
AMD下代APU性能大爆发,游戏表现能否真超RTX 5070 Ti?
雷军两会发声:新能源车牌设计需优化,能否告别“颜值砍半”?
雷军两会发声:新能源车牌设计需优化,能否告别“颜值砍半”?
2月安卓旗舰性能榜揭晓:一加Ace 5 Pro登顶,谁紧随其后?
2月安卓旗舰性能榜揭晓:一加Ace 5 Pro登顶,谁紧随其后?
首航新能储能系统:工商业能源管理升级的新引擎
首航新能储能系统:工商业能源管理升级的新引擎
鸿蒙原生版喜马拉雅:小艺助力,听音体验再升级!
鸿蒙原生版喜马拉雅:小艺助力,听音体验再升级!
燃油车智能化升级,一汽大众“三步走”战略能否重塑市场格局?
燃油车智能化升级,一汽大众“三步走”战略能否重塑市场格局?
热门内容
  • 浙大发布“浙大先生”,深度融合智能体DeepSeek V3/R1全国高校共享!
  • 美四大科技巨头豪掷2.3万亿,AI竞赛如火如荼,DeepSeek能否撼动?
  • DeepSeek大规模招聘,年薪百万岗位等你来,AI人才你准备好了吗?
  • AMD显卡本地部署DeepSeek教程来啦!轻松体验AI大模型
  • DeepSeek爆火!创始人梁文峰身家飙升,能否超越黄仁勋成亚洲新首富?
  • 夸克AI搜索升级“深度思考”,阿里自研模型加持,DeepSeek暂缺席
  • 微信接入AI新模型,腾讯股价暴涨近3000亿!
  • 微信生活服务添新成员,元宝App下载入口限时开放
  • 梁文锋参加巴黎AI峰会传闻不实,仍在国内引网友关切
  • 华为发布DeepSeek超融合一体机,全面适配V3&R1及蒸馏模型,加速AI应用
  • 七彩虹笔记本革新,“虹光AI”携手DeepSeek R1开启智能新篇章
  • 马斯克xAI发布Grok-3,杭州才子吴宇怀领衔创始团队亮相
  • 浙大AI团队开播DeepSeek系列公开课,每周五晚相约云端探秘
  • 梁文锋的DeepSeek之路:揭秘AI大模型背后的“第一桶金”来源
  • AI推荐彩票中奖5元,DeepSeek真的那么神吗?
本栏最新
中国移动李慧镝:AI融合网络,引领数智时代新飞跃
中国移动李慧镝:AI融合网络,引领数智时代新飞跃
中兴通讯MWC2025:全场景AI终端亮相,开启智能生活新篇章
中兴通讯MWC2025:全场景AI终端亮相,开启智能生活新篇章
CoreWeave纳斯达克上市在即,募资40亿美元,英伟达等巨头加持
CoreWeave纳斯达克上市在即,募资40亿美元,英伟达等巨头加持
Anthropic获35亿美元E轮融资,投后估值飙升至615亿美元
Anthropic获35亿美元E轮融资,投后估值飙升至615亿美元
2025年2月“钛度号”月榜:移民热降温,科技财经新趋势崛起!
2025年2月“钛度号”月榜:移民热降温,科技财经新趋势崛起!
火山引擎开源大模型应用,大模型应用实验室平台正式上线!
火山引擎开源大模型应用,大模型应用实验室平台正式上线!

本文链接:http://www.28at.com/showinfo-45-11347-0.html智谱AI新突破:CogView4文生图模型,首个开源支持汉字生成达SOTA

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:智谱大模型新突破!60亿参数CogView4文生图,领跑SOTA开启开源年

下一篇:阿里万相2.1开源引领视频AI新纪元,谷歌微美全息共赴全模态开源浪潮!

最新热点