百度语音大模型革新上线:对话超逼真,成本大降,1秒快答
2025-04-02 14:34:04 AI 11观看
摘要在人工智能技术日新月异的今天,百度再次引领了语音交互领域的创新风潮。近日,百度正式推出了业界首个基于全新互相关注意力(Cross-Attention)机制的端到端语音语言大模型,并率先在其产品文小言中上线,供用户免费体验。此次

在人工智能技术日新月异的今天,百度再次引领了语音交互领域的创新风潮。近日,百度正式推出了业界首个基于全新互相关注意力(Cross-Attention)机制的端到端语音语言大模型,并率先在其产品文小言中上线,供用户免费体验。jOJ28资讯网——每日最新资讯28at.com

jOJ28资讯网——每日最新资讯28at.com

此次升级后的文小言,以“超逼真语音交互、超低时延响应、超低成本应用”三大亮点吸引了广泛关注。其不仅能准确识别并回应重庆、广西、河南、广东、山东等地的特色方言,还能在对话中融入丰富的情感,使交互体验更加自然流畅。在时延方面,文小言将用户等待时间从行业普遍的3-5秒缩短至约1秒,几乎与真人对话无异。而在成本上,该模型在电话语音频道的问答场景中,调用成本较行业平均水平降低了50%-90%。jOJ28资讯网——每日最新资讯28at.com

据百度语音首席架构师介绍,该语音语言大模型能够部署在L20卡上,在满足语音交互延迟要求的前提下,双L20卡的并发处理能力可达数百以上。模型的训练流程也极为便捷,基于文心大模型,仅需数百张卡优化一周即可完成,且优化工作并不复杂。jOJ28资讯网——每日最新资讯28at.com

文小言不仅集成了包括天气查询、日历查询、单位换算、股票股价查询等在内的38个垂类助手,实现了高效的信息获取,还能应对时效性和非时效性问题。无论是百科查询、时政知识类问答,还是常识问答,文小言都能迅速给出精准答复。更重要的是,文小言能够与用户进行情感充沛的交流,快速响应反馈,实现了逼真拟人的交互效果。jOJ28资讯网——每日最新资讯28at.com

在实际应用中,文小言展现了其强大的方言识别能力和多轮交互能力。例如,在面对小朋友多次打断的情况下,文小言能够准确识别其需求,并适时给出有情感的回复,营造出自然对话的氛围。当用户提到心情不好时,文小言的语音中透露出担心,并引导用户说出原因进行开导,展现了其作为情感陪伴者的潜力。jOJ28资讯网——每日最新资讯28at.com

jOJ28资讯网——每日最新资讯28at.com

百度此次推出的端到端语音语言大模型,在技术创新方面取得了显著突破。作为业界首个基于Cross-Attention跨模态的语音语言大模型,该模型将Encoder与语音识别结合,使KV计算效率提升至十分之一。同时,Encoder与语音合成结合,实现了输出内容的情感控制。百度还研发了高效的全查询注意力EALLQA技术,进一步降低了KV cache的使用量。jOJ28资讯网——每日最新资讯28at.com

在模型训练过程中,百度采用了自蒸馏方式进行post-train训练,以成熟的文心语言预训练模型为基础,成功训练出了Cross-Attention端到端语音语言大模型。这一创新性的跨模态建模技术,实现了语音识别与大语言模型的深度融合,为语音交互领域带来了革命性的变化。jOJ28资讯网——每日最新资讯28at.com

jOJ28资讯网——每日最新资讯28at.com

在成本方面,该模型实现了低成本训练和低成本高速推理。通过流式逐字的LLM驱动的多情感语音合成技术,模型能够快速响应并给出有情感的回复。这一技术的应用,使得语音交互场景的应用潜力大幅提升,为大规模工业化应用提供了可能。jOJ28资讯网——每日最新资讯28at.com

百度在语音识别领域的深厚积累,为此次创新提供了坚实的基础。从Deep Peak 2模型到流式多级的截断注意力模型SMLTA,再到基于历史信息抽象的流式截断conformer建模技术SMLTA2,百度不断突破技术瓶颈,推动了语音识别技术的快速发展。此次端到端语音语言大模型的推出,更是将百度在语音交互领域的技术优势发挥到了极致。jOJ28资讯网——每日最新资讯28at.com

jOJ28资讯网——每日最新资讯28at.com

为了推动语音语言模型的规模化应用,百度已将其上线至文小言并免费开放。未来,该模型还将接入呼叫中心、音箱等业务线上,为更多用户提供高效便捷的语音交互体验。百度表示,将持续开放其技术创新成果,推动大语言模型在语音领域的应用,促进整个行业和生态的发展。jOJ28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
共振空间(RESONANCE):建筑与室内设计的领航者,如何诠释时代美学?
共振空间(RESONANCE):建筑与室内设计的领航者,如何诠释时代美学?
SpaceX极地载人飞行:首探地球两极,22项实验看点十足!
SpaceX极地载人飞行:首探地球两极,22项实验看点十足!
探月新篇章:嫦娥七号南极寻水冰,吴伟仁详解月球科研站蓝图
探月新篇章:嫦娥七号南极寻水冰,吴伟仁详解月球科研站蓝图
MG品牌3月销量大增82.6%,创新营销与渠道拓展助力销量飙升
MG品牌3月销量大增82.6%,创新营销与渠道拓展助力销量飙升
燃油车智能化转型难,电动汽车为何能领跑智能驾驶赛道?
燃油车智能化转型难,电动汽车为何能领跑智能驾驶赛道?
奥迪Q6L e-tron系列申报图曝光,轴距加长展现空间新优势
奥迪Q6L e-tron系列申报图曝光,轴距加长展现空间新优势
热门内容
  • 某大厂大模型高管涉婚变,公司账号停用引热议
  • 美团等巨头联手投资硅基流动,共筑生成式AI设施新蓝图
  • 00后主播借AI工具DeepSeek,直播单日狂揽3.3亿销售额!
  • 华为Pura X震撼发布:独特“阔折叠”形态,售价7499元起引领新潮流!
  • 立陶宛高校:学生不当使用AI,学术不端遭开除
  • 中国AI新突破!全球首款通用Agent产品Manus内测引热议
  • AI大模型时代,文科生将何去何从?
  • Ollama部署DeepSeek隐患多?腾云悦智安全实验室教你如何加固防护!
  • 夸克全新升级:AI超级框,你的全能助手来了!
  • Dify携手DeepSeek,基石智算助您轻松部署生成式AI应用
  • 阿里新夸克AI超级框上线,能否撼动腾讯元宝的AI入口地位?
  • 英伟达推出DGX Spark与Station个人AI超算,Spark版售3000美元起
  • 百度文心大模型4.5及X1正式发布,全面免费开放,性能对标国际前沿
  • 315曝光信息黑洞后,辽宁云企智能科技经营异常被列入名录
  • Ollama大模型工具安全隐患曝光:默认配置或致数据泄露与盗用
本栏最新
蓝思科技携手智元机器人,新设科技公司深耕智能研发领域
蓝思科技携手智元机器人,新设科技公司深耕智能研发领域
九章云极DataCanvas引领具身智能新生态,CEAI 2025大会展现技术闭环实力
九章云极DataCanvas引领具身智能新生态,CEAI 2025大会展现技术闭环实力
湖南二零八科技:三款新品引领惯性导航与测量组件国产化新浪潮
湖南二零八科技:三款新品引领惯性导航与测量组件国产化新浪潮
陶朗食品AI:重塑食品安全与效率,探索智能生产新未来
陶朗食品AI:重塑食品安全与效率,探索智能生产新未来
尤瓦尔·赫拉利预警:超级智能AI或将主导人类未来?
尤瓦尔·赫拉利预警:超级智能AI或将主导人类未来?
英特尔新帅陈立武:以“低调承诺,超额交付”引领复兴之路!
英特尔新帅陈立武:以“低调承诺,超额交付”引领复兴之路!

本文链接:http://www.28at.com/showinfo-45-11851-0.html百度语音大模型革新上线:对话超逼真,成本大降,1秒快答

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:中信金控与百度智能云共创佳绩,荣登信通院数字化转型典型案例榜

下一篇:东华软件西安布局,新设数据科技公司注册资本达千万

最新热点