在2025杭州云栖大会上,阿里巴巴一连发布七款人工智能大模型,其中通义万相Wan2.5-preview凭借音画一体视频生成能力引发行业震动。这款被阿里称为"最强全模态视觉生成模型"的新品,首次实现文本、图像、音频多模态输入与高清视频输出的无缝衔接,标志着视觉生成技术迈入电影级全感官叙事时代。
技术架构层面,Wan2.5-preview采用原生多模态训练框架,将声音、图像、文本作为统一语料进行模型训练。阿里云智能CTO周靖人透露,这种创新架构使模型具备跨模态推理能力,例如可根据充满隐喻的诗歌文本生成意境匹配的视觉画面。在图像生成质量上,模型支持24帧/秒的1080P高清输出,运镜指令遵循能力显著提升,可实现人物变身等复杂编辑任务。
实际测试显示,该模型在视频生成时长、画质、操控性三方面取得突破。单次生成视频时长从5秒延长至10秒,支持更完整的剧情叙事。在"白人女性拆礼物"场景测试中,模型精准还原了钢琴声、环境音效与人物对话的时空同步,连木柴燃烧的噼啪声都清晰可辨。更复杂的"婚礼求婚"场景里,新郎的誓言与婚礼进行曲的节奏配合毫无违和感,光影效果达到电影级水准。
多模态交互能力成为最大亮点。用户输入"VR玩家说唱"提示词时,模型不仅生成充满未来感的虚拟竞技场画面,更将Rap歌词的每个音节与人物口型精确匹配,即便语速极快也看不出破绽。在"深海特工"测试案例中,模型通过"图+文"输入生成了原本不存在的虎鲨背鳍,同时合成声呐扫描音、水流动响等12种环境音效,构建出沉浸式深海场景。
运动场景音效生成能力同样惊艳。在"骑士骑马"测试中,模型精准捕捉马蹄腾空、落地的力学节奏,同时合成远处裁判哨音与风声的层次变化。"女子网球"场景则还原了球拍破风声、球网撞击声与观众低语的立体声场,这些细节使AI生成内容几乎无法与实拍视频区分。
音乐生成领域,模型展现出对场景氛围的深度理解。当输入"黑人女子街舞"提示词时,自动生成的鼓点与贝斯旋律完美契合嘻哈风格,背景人群的掌声节奏与舞者动作形成巧妙呼应。技术团队透露,这种语境感知能力源于多模态预训练架构对海量视听数据的深度解析。
目前用户可通过阿里云百炼平台调用API,或在通义万相官网直接体验。数据显示,该模型家族已支持文生图、图生视频等10余种创作模式,累计生成3.9亿张图片和7000万个视频,成为中国调用量最大的视觉生成平台之一。自今年2月开源以来,20余款模型在社区的下载量突破3000万次,持续领跑开源视频生成领域。
更多>同类资讯2025云栖大会天猫精灵发布未来酒店4.0,AI赋能与联盟共绘酒店智能新蓝图09-25阿里巴巴吴泳铭云栖大会发声:AGI非终点,ASI时代蓝图徐徐展开09-25国台元宇宙·启元酒:虚实交融间,以酱香之韵探寻真我新境09-24从垂类设备到智能制造领头羊:“小巨人”领邦智能的AI视觉大模型蜕变之路09-24沙特研究新突破:AI推理能力可"提取转移",智能升级迎新路径09-24上海AI实验室创新:借学术讲座打造AI研究助手评测新基准09-24宇树科技王兴兴:人形机器人或年底至明年上半年可实时生成多样动作09-24阿里云AI战略重磅发布:3800亿投入迎ASI时代,十大核心要点解析09-24秘塔AI推出「Agentic Search」模式:边搜边做,20余种工具让想法秒变现实09-24雷军明日将迎健身百次打卡与年度演讲,小米17系列屏幕亮点抢先看09-24阿里吴泳铭云栖大会发声:3800亿资本开支再加码,剑指超级人工智能时代09-24阿里吴泳铭云栖发声:AGI仅是开篇,通往ASI三阶段路线及战略定位揭晓09-24Qwen3-Max数学满分领衔,Qwen3-VL等七大模型齐发,技术革新再升级09-24阿里云与英伟达强强联手,全面集成软件栈赋能物理AI全流程开发09-24周鸿祎:AGI短期难实现且藏风险,多智能体协同才是AI未来方向09-24点击查看更多 +全站最新
限量50台!梅赛德斯-迈巴赫V12 Edition官图亮相,24K金徽标配手工定制尽显奢华
宾利纯电动SUV谍照来袭,2026年发布,定位添越之下引期待
2026款沃尔沃EX90官图亮相:800V架构加持,双Orin芯片助力智能驾驶升级
东风日产新款天籁四季度上市,16-18万起售,鸿蒙座舱+2.0T引擎成亮点
Jeep大指挥官Trail Edition官图亮相 七座布局+2.0T柴油动力 限量150台仅售日本市场
兰博基尼汽车携手意大利海洋集团 全新Tecnomar 101FT游艇诠释海洋奢华新境热门内容
第22届东博会AI元素亮眼:数字智能体引路 机器人炫技展风采
AI云竞争下半场:华为以超节点、企业Agent等破局,谁能领跑产业?
2025网安周:每日互动刘宇谈AI时代,知识安全成关键,共筑数字新未来
中国大模型DeepSeek首登Nature封面,R1训练成本仅约208万引关注
华为全联接大会2025启幕,发布全球最强算力超节点与集群
有鹿机器人+连合直租:以智能租赁模式,开启高端场景清洁新未来
本文链接:http://www.28at.com/showinfo-45-28113-0.html阿里云栖大会重磅发布:通义万相Wan2.5-preview引领全模态视频生成新纪元
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。