Character.AI 突破性技术:实时 AI 角色视频互动
2025-07-08 10:06:41 AI 30观看
摘要 7 月 5 日消息,AI 聊天机器人平台 Character.AI 发布研究论文和视频演示,展示了名为 TalkingMachines 的自回归扩散模型,让 AI 角色互动更加逼真。该模型尚未部署在 Character.AI 平台上,根据研究论文和视频演示,

7 月 5 日消息,AI 聊天机器人平台 Character.AI 发布研究论文和视频演示,展示了名为 TalkingMachines 的自回归扩散模型,让 AI 角色互动更加逼真。rdm28资讯网——每日最新资讯28at.com

该模型尚未部署在 Character.AI 平台上,根据研究论文和视频演示,用户只需要输入一张图片和声音信号,该模型就能实现类似 FaceTime 的通话视觉互动。rdm28资讯网——每日最新资讯28at.com

该模型基于 Diffusion Transformer(DiT)技术,本质上是一种能够从随机噪声中创建详细图像的“艺术家”,并不断优化图像直至完美。Character.AI 所做的就是让这一过程变得极其迅速,达到实时效果。rdm28资讯网——每日最新资讯28at.com

rdm28资讯网——每日最新资讯28at.com

TalkingMachines 模型采用了流匹配扩散(Flow-Matched Diffusion)、音频驱动的交叉注意力(Audio-Driven Cross Attention)、稀疏因果注意力(Sparse Causal Attention)和不对称蒸馏(Asymmetric Distillation)等多种关键技术。rdm28资讯网——每日最新资讯28at.com

rdm28资讯网——每日最新资讯28at.com

其中流匹配扩散技术通过训练大量动作,包括细微的面部表情和更夸张的手势,确保 AI 角色动作更加自然。音频驱动的交叉注意力技术则让 AI 不仅能听到单词,还能理解音频中的节奏、停顿和语调,并将其转化为精确的口型、点头和眨眼。rdm28资讯网——每日最新资讯28at.com

rdm28资讯网——每日最新资讯28at.com

稀疏因果注意力技术让 Character.AI 能够以更高效的方式处理视频帧,而不对称蒸馏技术则让视频能够实时生成,营造出类似 FaceTime 通话的效果。rdm28资讯网——每日最新资讯28at.com

rdm28资讯网——每日最新资讯28at.com

Character.AI 强调,这一研究突破不仅仅是关于面部动画的,它是朝向实时互动的音频视觉 AI 角色迈出的一步。该模型支真实感人类、动漫和 3D 虚拟形象等多种风格。rdm28资讯网——每日最新资讯28at.com

rdm28资讯网——每日最新资讯28at.com

附上参考地址rdm28资讯网——每日最新资讯28at.com

GitHub 项目页面rdm28资讯网——每日最新资讯28at.com

TalkingMachines: Real-Time Audio-Driven FaceTime-Style Video via Autoregressive Diffusion Modelsrdm28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-14432-0.htmlCharacter.AI 突破性技术:实时 AI 角色视频互动

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:温网使用 AI 判罚引选手不满,组委会回应“系统比人工更可靠”

下一篇:苹果发布 DiffuCode-7B-cpGRPO 编程 AI 模型:基于 Qwen2.5-7B,可不按顺序生成代码

最新热点