生数科技发布高可控视频大模型 Vidu Q1:可精准调整所有动作行为
2025-04-01 07:04:34 AI 13观看
摘要 3 月 29 日消息,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军今日发布了高可控视频大模型 Vidu Q1,官方宣称其为业内首个高可控 AI 视频大模型。从官方获悉,Vidu Q1 在多主体细节可控(特别是动

3 月 29 日消息,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军今日发布了高可控视频大模型 Vidu Q1,官方宣称其为业内首个高可控 AI 视频大模型。fZe28资讯网——每日最新资讯28at.com

fZe28资讯网——每日最新资讯28at.com

从官方获悉,Vidu Q1 在多主体细节可控(特别是动作、布局可控)、音效同步可控、画质增强等方面均取得显著成效。以多主体细节可控为例,在语义指令的基础上,通过融入参考图的视觉指令,Vidu Q1 支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步的可控,对所有动作行为(出场、退场、坐立姿态、行动路线)进行精准调整。fZe28资讯网——每日最新资讯28at.com

fZe28资讯网——每日最新资讯28at.com

其支持音效同步可控功能,可确保随着视频环境与画面转场,Vidu Q1 能够输出生成相应音效,并可精准控制每段音效的长短区间,精准设置每段音频出现的时间点,如 0-2s 风声、3-5s 雨声等。fZe28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11800-0.html生数科技发布高可控视频大模型 Vidu Q1:可精准调整所有动作行为

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:父母用 AI 自行问诊险误孩子病情,汕头大学医学院第一附属医院提醒“用药诊断应遵循专业医生意见”

下一篇:李开复:DeepSeek 的成功证明闭源是“死路”,开源才有更大发展

最新热点