快手联合推出 Pyramid Flow 开源文生视频 AI 模型:最高 10 秒 768P@24fps,创新金字塔流匹配让推理 tokens 降至 1 4
2024-10-14 16:21:20 AI 50观看
摘要 10 月 12 日消息,由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型,用户在输入文本之后,即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。Pyramid Flo

10 月 12 日消息,由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型,用户在输入文本之后,即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。pn028资讯网——每日最新资讯28at.com

Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等,提供更高效、更灵活的视频生成解决方案,目前已经在 Hugging Face 平台上线,并完全开源。pn028资讯网——每日最新资讯28at.com

pn028资讯网——每日最新资讯28at.com

pn028资讯网——每日最新资讯28at.com

pn028资讯网——每日最新资讯28at.com

pn028资讯网——每日最新资讯28at.com

查询官方介绍,附上 Pyramid Flow 的核心特点如下:pn028资讯网——每日最新资讯28at.com

高效生成:Pyramid Flow 采用新技术,通过统一 AI 模型分阶段生成视频,大多数阶段为低分辨率,只有最后阶段为全分辨率。这种“金字塔流匹配”方法保持了视频的高视觉质量前提下,大幅降低了计算成本,tokens 数量是传统 diffusion 模型的四分之一。pn028资讯网——每日最新资讯28at.com

快速推理:在推理过程中,该模型可以在 56 秒内生成一个 5 秒、384p 的视频,速度媲美许多全序列 diffusion 模型,甚至更快。pn028资讯网——每日最新资讯28at.com

开源和商业使用:Pyramid-Flow 在 MIT 许可证下发布,允许广泛的使用,包括商业应用、修改和再分发,吸引了希望将模型集成到专有系统中的开发者和公司。pn028资讯网——每日最新资讯28at.com

附上参考地址pn028资讯网——每日最新资讯28at.com

Pyramidal Flow Matching for Efficient Video Generative Modelingpn028资讯网——每日最新资讯28at.com

New high quality AI video generator Pyramid Flow launches — and it’s fully open source!pn028资讯网——每日最新资讯28at.com

Hugging Facepn028资讯网——每日最新资讯28at.com

Githubpn028资讯网——每日最新资讯28at.com

Pyramidal Flow Matching for Efficient Video Generative Modelingpn028资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-9072-0.html快手联合推出 Pyramid Flow 开源文生视频 AI 模型:最高 10 秒 768P@24fps,创新金字塔流匹配让推理 tokens 降至 1 4

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:上海交大联合开发 AI 系统,首次实现孕前精准预测流产风险

下一篇:5万神车?K-CAR侧滑门+超大空间,这波操作能火?

最新热点