首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造 AI 开源模型 Hallo2
2024-10-23 09:18:41 AI 32观看
摘要 10 月 21 日消息,复旦大学和百度联合开发了一款名为 Hallo2 的全新 AI 模型,该模型可以生成长达数小时的 4K 分辨率人物动画,现已在 GitHub 发布开源。Hallo2 模型建立在 latent diffusion models 的基础上,相比

10 月 21 日消息,复旦大学和百度联合开发了一款名为 Hallo2 的全新 AI 模型,该模型可以生成长达数小时的 4K 分辨率人物动画,现已在 GitHub 发布开源。iFg28资讯网——每日最新资讯28at.com

iFg28资讯网——每日最新资讯28at.com

Hallo2 模型建立在 latent diffusion models 的基础上,相比上一代Hallo 模型的效果更好,支持了长视频生成,通过引入数据增强方法如 patch-drop 和高斯噪声,有效提高了长时间视频的视觉一致性和时间连贯性。iFg28资讯网——每日最新资讯28at.com

iFg28资讯网——每日最新资讯28at.com

Hallo2 还结合了向量量化生成对抗网络和时间对齐技术,保证了高分辨率视频的质量和流畅性。iFg28资讯网——每日最新资讯28at.com

此外,Hallo2将可调整的语义文本标签的肖像表情作为条件输入。这超出了传统的音频提示,可以提高可控性并增加所生成内容的多样性。项目页面介绍称,Hallo2 是第一种实现 4K 分辨率并生成长达 1 小时的音频驱动的人像图像动画的方法,并通过文本提示进行增强。iFg28资讯网——每日最新资讯28at.com

iFg28资讯网——每日最新资讯28at.com

附Hallo2 项目地址如下:iFg28资讯网——每日最新资讯28at.com

https://fudan-generative-vision.github.io/hallo2/#/iFg28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-9198-0.html首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造 AI 开源模型 Hallo2

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:北京写字楼租金持续下滑,下降趋势何时止?

下一篇:沈抖掌舵百度智能云,新征途能否再创辉煌?

最新热点