阶跃星辰推出Step-Audio2mini,端到端语音大模型刷新多项国际基准测试成绩
2025-09-02 09:16:53 AI 27观看
摘要阶跃星辰公司近期震撼发布了其倾力打造的开源端到端语音大模型——Step-Audio2mini。这款模型在国际多项基准测试中脱颖而出,刷新了SOTA记录,将语音理解、音频推理与生成融为一体,展现了卓越的全方位能力。无论是在音频

阶跃星辰公司近期震撼发布了其倾力打造的开源端到端语音大模型——Step-Audio2mini。这款模型在国际多项基准测试中脱颖而出,刷新了SOTA记录,将语音理解、音频推理与生成融为一体,展现了卓越的全方位能力。无论是在音频理解、语音识别,还是在跨语种翻译、情感解析及语音对话等应用场景中,Step-Audio2mini均展现出了非凡的实力。2Th28资讯网——每日最新资讯28at.com

尤为Step-Audio2mini在音频处理领域的多个核心测试中,表现远超Qwen-Omni、Kimi-Audio等同类开源模型,甚至在多数任务上超越了GPT-4o Audio。在通用多模态音频理解测试集MMAU上,它以73.2的高分傲视群雄;在口语对话能力评估平台URO Bench的基础与专业赛道上,Step-Audio2mini同样夺得了开源端到端语音模型的最高分。在中英互译任务中,它在CoVoST2和CVSS评测集上的分数分别为39.3和29.1,大幅领先竞争对手。而在语音识别方面,Step-Audio2mini在多语言和多方言测试中均排名第一,其中中文测试集的平均字错误率为3.19%,英文测试集的平均词错误率为3.50%,性能超出其他开源模型15%以上。2Th28资讯网——每日最新资讯28at.com

Step-Audio2mini之所以能在众多模型中脱颖而出,得益于其创新的架构设计。它摒弃了传统的ASR+LLM+TTS三级结构,采用了真端到端多模态架构,实现了从原始音频输入到语音响应输出的直接转换,不仅架构更加简洁,时延也大幅降低。同时,该模型还能有效理解副语言信息和非人声信号,进一步提升了其综合性能。Step-Audio2mini还首次在端到端语音模型中引入了链式思维推理(CoT)与强化学习的联合优化技术,使其能够更精细地理解、推理情绪、语调、音乐等副语言和非语音信号,并作出自然回应。2Th28资讯网——每日最新资讯28at.com

Step-Audio2mini的实际应用能力同样令人印象深刻。它能够准确识别大自然的声音和精湛的配音,还能实时搜索行业最新资讯,为用户提供有价值的信息。同时,该模型还支持控制语速,轻松适应不同场景的对话需求。在一次测试中,当面对一个复杂的哲学问题时,Step-Audio2mini展现出了强大的逻辑推理能力,将抽象问题转化为极简方法论,给出了令人信服的答案。2Th28资讯网——每日最新资讯28at.com

目前,Step-Audio2mini模型已在GitHub、Hugging Face和ModelScope等平台上线,供用户下载、试用并反馈。感兴趣的用户可以访问以下链接获取更多信息:2Th28资讯网——每日最新资讯28at.com

GitHub链接:https://github.com/stepfun-ai/Step-Audio22Th28资讯网——每日最新资讯28at.com

Hugging Face链接:https://huggingface.co/stepfun-ai/Step-Audio-2-mini2Th28资讯网——每日最新资讯28at.com

ModelScope链接:https://www.modelscope.cn/models/stepfun-ai/Step-Audio-2-mini2Th28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0    更多>同类资讯科大讯飞湾区总部及产业加速中心深圳启动,赋能区域数字化转型每经AI快讯,据深圳发布,近日,科大讯飞湾区总部及深圳产业加速中心在深圳龙华正式启动,迈出在粤港澳大湾区深化布局的关键一步。产业加速中心依托科大讯飞核心技术能力和国家新一代人工智能开放创新平台集聚的开发者资源…09-01阿里:AI与消费双轮驱动,财报超预期展现强劲增长力过去四个季度,我们已经在 AI 基础设施以及 AI 产品研发上累计投入超过 1000 亿元”,吴泳铭说,阿里对 AI的投入已开始显现成果,无论是阿里云在客户的 AI 需求下恢复高速增长,还是广泛的 to C…09-012025数智化转型论坛:AI大模型与AI Agent引领破界反卷新篇章正是在这样的背景之下,由数智猿×数据猿联合主办,中关村科学城公司协办,新华社中国经济信息社×北京软件和信息服务业协会×中国互联网协会数字化转型与发展工作委员会×上海大数据联盟作为支持单位的的“2025第五届…09-01科大讯飞湾区总部启航龙华,深圳产业加速中心赋能创新生态产业加速中心依托科大讯飞核心技术能力和国家新一代人工智能开放创新平台集聚的开发者资源,打造“线上+线下”相融合的创新创业服务加速平台,为开发者、创业企业和区域产业数字化转型提供线下赋能,通过创业孵化、产业聚…09-01科大讯飞湾区总部启动深圳加速中心,全方位赋能中小微企业转型升级来源:证券时报e公司 人民财讯8月31日电,据深圳发布,近日,科大讯飞湾区总部及深圳产业加速中心在深圳龙华正式启动,迈出在粤港澳大湾区深化布局的关键一步。产业加速中心依托科大讯飞核心技术能力和国家新一代人工智…09-01科大讯飞再传捷报:中标安徽税务智能咨询子系统运行维护项目证券之星消息,根据天眼查APP-财产线索数据整理,根据国家税务总局安徽省税务局月8日28发布的《国家税务总局安徽省税务局安徽税务2025年12366纳税缴费服务热线系统(智能咨询子系统)运行维护项目(二次)中…09-01科大讯飞湾区总部深圳龙华启航,生态企业集群入驻共促AI产业发展来源:IT之家 【科大讯飞湾区总部落户深圳,与龙华区共建产业加速中心整合上下游产业链资源】科大讯飞湾区总部及深圳产业加速中心项目在深圳龙华正式启动,已吸引15家生态企业入驻,8家签约。中心将整合上下游资源,助…09-01微软AI自研大模型亮相,语音模型定制化程度高,CEO谈与OpenAI关系MustafaSuleyman:我认为世界上最优秀的人才,想要做的是那些真正有影响力的工作,能带来改变、能做出优秀产品,同时解决如何高效实现目标的技术挑战。Mustafa Suleyman:是的,我们已…08-31微信新规:AI生成内容将加显式隐式标识,提升信息透明度08-31区域算力网研究报告贵阳首发:探索构建全国算力“一张网”新路径8月29日,由国家信息中心和华为公司牵头,联合政产学研30余家相关机构共同编写的《区域算力网:高速互联篇研究报告》(简称《研究报告》)在贵阳发布。 据悉,2024年,国家信息中心与华为等单位,围绕城市算力专…08-31中国移动2025数博会展全栈AI实力,筑基算力网络引领数智化新篇章能力中台作为中国移动“两个新型”“BASIC6”“AI+”三大计划的重要组成部分,汇聚涵盖了AI、大数据、物联网等领域的1300余项内外部优质数智能力,为企业客户提供数据技术支持、模型训练、智能应用开发等一…08-31华为AI SSD新品亮相,全球存储产业HBM、NAND闪存、CXL技术王牌竞相角逐2025年8月27日,华为存储又结新果,华为在数据存储AI SSD新品发布会上正式推出三款针对AI存储的新产品。 在AI大模型训练、多模态数据处理需求爆发的当下,除华为之外,全球存储领域的更多玩家,争相竞逐H…08-31马斯克xAI公司状告前工程师,指控其盗取AI机密投奔OpenAI08-30百度智能云升级AI平台,引领企业步入智能经济新时代从十年前我们开始探索AI云的全栈布局,到今天见证整个AI产业生态的全面爆发,我们很高兴的看到,越来越多的同行开始加大智能投入,丰富了从底层基础设施、到大模型以及开发平台的选择;也看到,越来越多的客户和伙伴也…08-30AI云赛道领航,百度智能云何以成为企业转型升级首选伙伴?从2015年正式对外提供云服务,百度智能云明确了“三位一体”人工智能(AI)、大数据(Big Data)与云计算(Cloud Computing)的发展策略,到2020年确立“云智一体”理念,再到如今,百…08-30点击查看更多 +全站最新汽车行业下半场:智驾时代,大咖共探换挡新机遇汽车行业下半场:智驾时代,大咖共探换挡新机遇格力电器二季度营收下滑,多元化之路成破局关键格力电器二季度营收下滑,多元化之路成破局关键日资房产市场升温,外资涌入创新高,中国楼市对比显冷清日资房产市场升温,外资涌入创新高,中国楼市对比显冷清万事利上半年营收增长8.29%,AI技术引领丝绸产业转型升级万事利上半年营收增长8.29%,AI技术引领丝绸产业转型升级德力佳传动上市路:客户采销数据差异大,研发占比低却毛利率高,关联交易频现德力佳传动上市路:客户采销数据差异大,研发占比低却毛利率高,关联交易频现牛散章建平被误认,紧急澄清:未买寒武纪股票,网传照片系他人牛散章建平被误认,紧急澄清:未买寒武纪股票,网传照片系他人热门内容
  • 苹果加速AI布局,或收购两家法国AI初创企业
  • DeepSeek V3.1大模型升级,适配国产新芯片,性能显著提升
  • 苹果AI布局加速,或将斥巨资收购欧洲两大AI初创企业
  • 红米Note15系列前瞻:7s芯片、7000mAh大电池,防水新标杆即将登场
  • 浙大发布“悟空”类脑计算机:神经元规模超20亿,模拟猕猴大脑
  • 科创板AI基金8月22日净值飙升7.79%,重仓股表现抢眼
  • vivo X300系列新机入网:首发LYT-828+2亿像素,卫通版支持北斗卫星短信
  • 可可西里迎来科技新成员:“机器藏羚羊”助力零干扰科研观测
  • 科创AIETF资金净流入破15亿,GPT-5发布助推AI市场热议
  • OpenAI冲刺5000亿估值,GPT-5遇冷:资本狂欢与技术瓶颈的碰撞
  • 华为云重组风暴:多部门整合,聚焦AI领域引发关注
  • 高德地图2025:开启AI出行新时代,打造全球首个地图AI原生智能体
  • AI冲击职场:美国毕业生失业率飙升,科技行业首当其冲
  • 科大讯飞股价上扬1.51%,机构聚焦AI应用落地,讯飞成投资热点
  • 华为银联联手,8月12日揭秘AI推理加速新技术,助力AI生态升级
本栏最新阿里:AI与消费双轮驱动,财报超预期展现强劲增长力阿里:AI与消费双轮驱动,财报超预期展现强劲增长力2025数智化转型论坛:AI大模型与AI Agent引领破界反卷新篇章2025数智化转型论坛:AI大模型与AI Agent引领破界反卷新篇章科大讯飞再传捷报:中标安徽税务智能咨询子系统运行维护项目科大讯飞再传捷报:中标安徽税务智能咨询子系统运行维护项目科大讯飞湾区总部深圳龙华启航,生态企业集群入驻共促AI产业发展科大讯飞湾区总部深圳龙华启航,生态企业集群入驻共促AI产业发展微软AI自研大模型亮相,语音模型定制化程度高,CEO谈与OpenAI关系微软AI自研大模型亮相,语音模型定制化程度高,CEO谈与OpenAI关系区域算力网研究报告贵阳首发:探索构建全国算力“一张网”新路径区域算力网研究报告贵阳首发:探索构建全国算力“一张网”新路径

本文链接:http://www.28at.com/showinfo-45-27224-0.html阶跃星辰推出Step-Audio2mini,端到端语音大模型刷新多项国际基准测试成绩

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:MedResearcher-R1:医疗AI推理新突破,知识图谱赋能智能轨迹合成

下一篇:一句“吴恩达说的”,就能让 GPT-4o mini 言听计从

最新热点