OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换
2025-09-01 09:28:35 网络 11观看
摘要 快科技9月1日消息,OpenAI正式发布语音模型GPT-realtime。据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解

快科技9月1日消息,OpenAI正式发布语音模型GPT-realtime。Mmt28资讯网——每日最新资讯28at.com

据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。Mmt28资讯网——每日最新资讯28at.com

OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换Mmt28资讯网——每日最新资讯28at.com

官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、更具表现力的语音方面表现卓越。尤其在重复字母与数字、逐字朗读免责声明、语句间无缝切换语言等场景中,GPT-realtime展现出优秀的适应能力。Mmt28资讯网——每日最新资讯28at.com

该模型还具备出色的上下文理解能力,可准确捕捉非语言线索(如笑声),并实时调整语音语气,实现诸如“带法国口音的友好语调”或“语速较快的专业语调”等多样化表达。Mmt28资讯网——每日最新资讯28at.com

此外,GPT-realtime新增了“Cedar”和“Marin”两种语音风格,并对现有八种语音效果进行了全面优化。Mmt28资讯网——每日最新资讯28at.com

OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换Mmt28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-17-179524-0.htmlOpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:三千万辆中国车利润不如丰田局面还在:1-7月我国汽车行业利润率仅4.6%

下一篇:有你公司福利好吗!5年增长近1倍 台积电2024年员工人均薪资福利83.4万

最新热点