亚马逊近日震撼发布了一款名为Nova Sonic的先进生成式AI语音模型,该模型能够直接处理并生成自然流畅的语音,标志着亚马逊在AI语音技术上的重大突破。
据悉,Nova Sonic在速度、语音识别及对话质量等核心指标测试中,展现出了与OpenAI和谷歌顶尖语音模型相抗衡的实力。这一成就不仅是亚马逊对诸如ChatGPT语音模式等新兴AI语音模型的有力回应,也预示着AI语音交互新时代的到来。

相较于亚马逊早期的Alexa模型,Nova Sonic在语音交互上更加自然流畅,为用户带来了全新的体验。通过亚马逊的Bedrock开发者平台,用户可轻松接入Nova Sonic,该平台专为构建企业级AI应用而设计。Nova Sonic采用了一个创新的双向流式API,进一步提升了其应用灵活性和便捷性。
亚马逊在新闻稿中自豪地宣称,Nova Sonic是市场上“最具成本效益”的AI语音模型,其价格相比OpenAI的GPT-4o模型便宜了约80%。这一价格优势无疑将吸引更多开发者选择Nova Sonic作为他们的AI语音解决方案。
据亚马逊高级副总裁兼人工通用智能(AGI)部门首席科学家罗希特·普拉萨德介绍,Nova Sonic的部分组件已经为亚马逊升级版数字语音助手Alexa+提供了强大动力。普拉萨德还表示,与竞争对手的AI语音模型相比,Nova Sonic在路由用户请求到不同API方面表现出色,能够智能地判断何时需要从互联网获取实时信息、解析专有数据源或在外部应用程序中采取行动。
在双向对话场景中,Nova Sonic展现出了极高的智能性。它会等待“合适的时机”发言,充分考虑说话者的停顿和打断等情况,使得对话更加自然流畅。Nova Sonic还能为用户的语音生成文本记录,这些文本记录可被开发者用于各种应用场景,进一步拓展了其应用潜力。
在语音识别方面,Nova Sonic同样表现出色。据普拉萨德介绍,Nova Sonic的语音识别错误率比其他AI语音模型更低,即使在用户咕哝、说错话或处于嘈杂环境中时,也能准确理解用户的意图。在一项跨语言和方言的语音识别基准测试——多语言LibriSpeech中,Nova Sonic在英语、法语、意大利语、德语和西班牙语上的平均单词错误率(WER)仅为4.2%,这一成绩令人瞩目。
在衡量多人参与的高音量互动基准测试——增强多方互动中,Nova Sonic也展现出了卓越的性能。亚马逊称,Nova Sonic在单词错误率方面比OpenAI的GPT-4o-transcribe模型准确率高出46.7%。同时,Nova Sonic还拥有行业领先的速度,其平均感知延迟为1.09秒,比OpenAI为实时API提供动力的GPT-4o模型更快。
Nova Sonic的发布是亚马逊构建人工通用智能(AGI)这一更广泛战略的重要组成部分。普拉萨德表示,亚马逊计划推出更多能够理解不同模态(包括图像、视频和语音)的AI模型,以及“其他在将事物引入物理世界时相关的感官数据”。这一战略无疑将推动亚马逊在AI领域的持续创新和领先。
举报 0收藏 0打赏 0评论 0分享 0 更多>同类资讯
华硕ROG DAY大揭秘:初音联名新品与神秘板皇即将震撼登场!04-09
Instagram或推iPad版应用,借TikTok挑战加速转型?04-09
微型伺服电缸:如何引领电池与人形机器人领域的双重革新?04-09
VK瓦尔基里B-GT水冷新品上市,3.95寸磁吸屏个性显示仅459元起04-09三星德国27万客户数据遭泄露,黑客攻击风险隐患何解?04-09
百度20-F年报揭秘:李彦宏持股近两成,投票权近六成04-09微软Teams:90天未更新将无法登录使用,你更新了吗?04-09
百度年报揭秘:李彦宏持股近两成,投票权近六成掌控全局04-09
AMD Zen系列处理器EntrySign漏洞已修复,用户需尽快安装安全补丁04-09
微星RTX 5060 Ti 16GB显卡系列曝光:多款新品即将上市04-09
高铁司机:如何精准操控“陆地飞行器”,保障乘客安全平稳出行?04-09腾讯新动作!上海微薯商业管理公司注册成立,注册资本达千万04-09慈星股份新动作:嘉兴成立智能机器人公司,注册资本达2000万04-09
滴滴重启巴西外卖业务,能否突破iFood等巨头包围圈?滴滴在墨西哥推出外卖业务平台DiDi Food,主要通过“出行+外卖”双引擎模式,将单均成本下降15%,用户留存率提升至68%,这种与车主协同构建的低价差异化竞争优势,使滴滴在墨西哥外卖市场市占率已超过50%…04-09沃尔玛的中国“双面”策略:山姆高歌,大卖场“低价”突围沃尔玛作为一个零售企业,在中国市场上表现出了颇为奇特状态:山姆向上,继续以高增长的姿态,博取高利润率;沃尔玛向下,以庞大的规模优势拼命压缩供应链利润率,向包括中国在内的全球市场提供低价商品,形成一种剪刀差般…04-09点击查看更多 +全站最新
《霍格沃茨之遗》Switch 2版评测:画质流畅度显著提升,接近高端主机体验
多家银行相继叫停ATM无卡交易,招行扫码存款服务也成历史?
百度20-F年报揭秘:李彦宏持股近两成,投票权近六成
《吸血鬼幸存者》跨平台存储更新在即,PS版却遭延期困扰!
百度年报揭秘:李彦宏持股近两成,投票权近六成掌控全局
Ediloca存储新品亮相NAB SHOW,以技术创新引领存储科技新潮流热门内容
VK瓦尔基里B-GT水冷新品上市,3.95寸磁吸屏个性显示仅459元起
百度20-F年报揭秘:李彦宏持股近两成,投票权近六成
百度年报揭秘:李彦宏持股近两成,投票权近六成掌控全局
AMD Zen系列处理器EntrySign漏洞已修复,用户需尽快安装安全补丁
微星RTX 5060 Ti 16GB显卡系列曝光:多款新品即将上市
高铁司机:如何精准操控“陆地飞行器”,保障乘客安全平稳出行?
本文链接:http://www.28at.com/showinfo-16-142667-0.html亚马逊发布Nova Sonic语音模型,挑战OpenAI与谷歌前沿技术
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。