智源推出全能视觉生成模型 OmniGen:支持文生图、图像编辑等
2024-11-01 09:36:11 AI 29观看
摘要 10 月 29 日消息,北京智源人工智能研究院(BAAI)推出了新的扩散模型架构 OmniGen,这是一种用于统一图像生成的多模态模型。▲文本生成图像,编辑生成图像的部分元素,根据生成图像的人体姿态生成重绘图像,从另一图像中

10 月 29 日消息,北京智源人工智能研究院(BAAI)推出了新的扩散模型架构 OmniGen,这是一种用于统一图像生成的多模态模型。O0428资讯网——每日最新资讯28at.com

O0428资讯网——每日最新资讯28at.com

▲文本生成图像,编辑生成图像的部分元素,根据生成图像的人体姿态生成重绘图像,从另一图像中提取所需对象与新图像融合

官方表示,OmniGen 具有以下特点:O0428资讯网——每日最新资讯28at.com

统一性:OmniGen 天然地支持各种图像生成任务,例如文生图、图像编辑、主题驱动生成和视觉条件生成等。此外,OmniGen 可以处理经典的计算机视觉任务,将其转换为图像生成任务。O0428资讯网——每日最新资讯28at.com

简单性:OmniGen 的架构高度简化。此外,与现有模型相比,它更加用户友好,可以通过指令完成复杂的任务,而不需要冗长的处理步骤和额外的模块 (如 ControlNet 或 IP-Adapter),从而大大简化了工作流程。O0428资讯网——每日最新资讯28at.com

知识迁移:受益于统一格式的学习,OmniGen 有效地跨不同任务迁移知识,应对未见过的任务和领域,并展示新颖的功能。我们还探讨了模型的推理能力和思维链机制的在图像生成领域的潜在应用。O0428资讯网——每日最新资讯28at.com

O0428资讯网——每日最新资讯28at.com

▲指代表达生成

附相关链接如下:O0428资讯网——每日最新资讯28at.com

论文:https://arxiv.org/pdf/2409.11340O0428资讯网——每日最新资讯28at.com

代码:https://github.com/VectorSpaceLab/OmniGenO0428资讯网——每日最新资讯28at.com

演示:https://huggingface.co/spaces/Shitao/OmniGenO0428资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-9348-0.html智源推出全能视觉生成模型 OmniGen:支持文生图、图像编辑等

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:全国首批人形机器人具身智能标准发布:按下肢运动、上肢作业等分 4 个等级

下一篇:微软开源 OmniParser 纯视觉 GUI 智能体:让 GPT-4V 秒懂屏幕截图,可操控手机 电脑

最新热点