阿里通义万相今日宣布了一项重大技术突破,正式向公众开源其创新的“首尾帧生视频模型”。该模型以惊人的140亿参数规模,在业界首次实现了如此大规模的开源首尾帧视频生成技术。
这款模型的核心功能在于,用户仅需提供一张起始图片和一张结束图片,它便能自动生成一段高清720p的视频,完美衔接首尾画面。这一技术的问世,无疑将为用户带来前所未有的视频生成体验,满足更加个性化和定制化的需求。
为了让更多用户能够轻松体验这一前沿技术,阿里通义万相提供了多种获取途径。用户可以直接访问通义万相官网,免费试用该模型;同时,该模型也已在Github、Hugging Face以及魔搭社区等平台上线,供开发者下载并进行本地部署和二次开发。
首尾帧生视频技术相较于文生视频和单图生视频,具有更高的可控性。然而,这类模型的训练难度也相应提升。为了确保生成的视频内容既与用户输入的两张图像保持一致,又能遵循用户的提示词指令,同时实现从首帧到尾帧的自然、流畅过渡,阿里通义万相团队在模型设计上下了不少功夫。
基于现有的Wan2.1文生视频基础模型架构,团队引入了额外的条件控制机制,从而实现了首尾帧视频生成的精准与流畅。在训练阶段,团队构建了专门用于首尾帧模式的训练数据,并采用了并行策略来优化文本与视频编码模块以及扩散变换模型模块,这不仅提升了模型的训练效率,还确保了高清视频生成的效果。

在推理阶段,面对有限的内存资源,团队采用了模型切分策略和序列并行策略,在确保推理效果不受影响的前提下,大幅缩短了推理时间,使得高清视频推理成为可能。
这款首尾帧生视频模型不仅技术先进,而且在功能上也有着诸多亮点。用户可以利用它完成更加复杂和个性化的视频生成任务,如实现同一主体的特效变化、不同场景的运镜控制等。例如,用户只需上传两张相同位置但不同时间段的外景图片,并输入一段提示词,模型便能生成一段展现四季交替或昼夜变化的延时摄影效果视频。用户还可以通过旋转、摇镜、推进等运镜控制,将两张不同画面的场景巧妙衔接,使视频在保持与预设图片一致性的同时,拥有更加丰富的镜头语言。

这一技术的推出,无疑将为视频创作领域带来一场革命性的变革。无论是专业视频制作者还是普通用户,都将能够利用这一技术轻松实现心中的创意,创作出独一无二的视频作品。
举报 0收藏 0打赏 0评论 0分享 0 更多>同类资讯居然智家CEO汪林朋被留置,公司运营正常,控制权未变4月17日,居然智家发布公告,公司收到实际控制人、董事长兼CEO汪林朋家属通知,汪林朋近日收到武汉市江汉区监察委员会签发的《留置通知书》和《立案通知书》。目前公司其他董事、监事和高级管理人员均正常履职,控制权…04-17
2025电竞世界杯赛程来袭,DOTA2与无畏契约7月8日打响头炮!04-17
居然智家CEO汪林朋被留置,公司运营正常称已妥善安排04-17
同程旅行豪掷25亿,万达高端酒店品牌易主引关注04-17
贾跃亭反击恶意做空:坚定保住上市地位,誓要打赢梦想之战04-17
光韵达跨界并购亿联无限,能否扭转业绩颓势?光韵达(300227.SZ)昨晚发布公告,称拟以现金方式收购深圳市亿联无限科技股份有限公司(以下简称“亿联无限”)100%的股份,对价不超过6.5亿元。 据招股书,亿联无限原计划募资3.68亿元用于长沙生产…04-17
朗高电机一季度业绩飙升,如何以四大优势领跑新能源商用车赛道?04-17
徐工高空作业机械美洲市场大放异彩,全面展现中国制造硬实力!04-17
ZOL“潮好玩”系列活动武汉站,中国地质大学即将开启科技盛宴!04-17
锐捷极简以太全光4.0:五年深耕,三大创新,重塑网络连接新高度!04-17美京大战背后:即时零售成关键战场,京东美团谁能更胜一筹?04-17
我国科学家解锁野生稻遗传宝藏,为超级水稻育种铺路,Nature点赞!04-17
Chrome安卓版尝试新操作:地址栏可移至底部?04-17李永乐透露网红收入真相:粉丝多不代表收入高,知识变现难4月17日,据财经网科技,因一堂物理网课后红色李永乐在采访时称,自己做网红并没有上千万收入。那我在互联网上,如果全部都算上了,也得有四五千万粉丝。 他还指出不少人都面临这个问题,像一些科普博主,做了很多的科普…04-17
瓜瓜龙启蒙告别倒计时:2026年4月14日后将停止服务亲爱的用户,感谢您对瓜瓜龙的喜爱,因业务调整,瓜瓜龙启蒙将持续运营至2026年4月14日,请您尽快观看学习,2026年4月15日起瓜瓜龙启蒙将停止服务,停止服务后我们将依法对您的个人信息进行删除或匿名化处理…04-17点击查看更多 +全站最新
仰望U8L霸气亮相!黑金配色车身超路虎揽胜,国产豪华新巅峰?
鸿蒙智行新车齐发:问界M8与享界S9增程版震撼登场,尚界品牌惊艳亮相
智界R7增程大电池版上市,挑战理想L6,续航破千六售29.98万起
辅助驾驶非自动驾驶,误用或宣传不当将受法律严惩
哈弗二代大狗Hi4版换新颜,插电混动能否再掀热潮?
极氪007GT上市,科技猎装新风尚,女性车主占比高达四成!热门内容
2025电竞世界杯赛程来袭,DOTA2与无畏契约7月8日打响头炮!
居然智家CEO汪林朋被留置,公司运营正常称已妥善安排
同程旅行豪掷25亿,万达高端酒店品牌易主引关注
贾跃亭反击恶意做空:坚定保住上市地位,誓要打赢梦想之战
光韵达跨界并购亿联无限,能否扭转业绩颓势?
朗高电机一季度业绩飙升,如何以四大优势领跑新能源商用车赛道?
本文链接:http://www.28at.com/showinfo-16-145208-0.html阿里通义万相发布业界领先首尾帧视频生成模型,开源引关注
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。