阿里Qwen3大模型登顶开源榜首，235B参数展现强劲实力-28资讯网——每日最新资讯28at.com

知多少

元宇宙

全部频道

阿里Qwen3大模型登顶开源榜首，235B参数展现强劲实力

2025-05-15 09:51:52 AI 235观看

摘要近日，阿里巴巴正式揭晓了其新一代大模型Qwen3系列的技术细节，通过一份详尽的技术报告，向公众展示了该系列模型的混合推理架构、独特的训练策略以及令人瞩目的评测成绩。报告显示，Qwen3系列的旗舰模型Qwen3-235B-A22B在数

近日，阿里巴巴正式揭晓了其新一代大模型Qwen3系列的技术细节，通过一份详尽的技术报告，向公众展示了该系列模型的混合推理架构、独特的训练策略以及令人瞩目的评测成绩。报告显示，Qwen3系列的旗舰模型Qwen3-235B-A22B在数学推理、代码生成等多个核心评测领域，超越了包括DeepSeek-R1和Grok-3在内的国际顶尖模型。

Qwen3系列大模型于4月29日正式发布，涵盖了6款稠密模型和2款MoE模型，参数规模从0.6B到235B不等。其中，旗舰模型Qwen3-235B-A22B凭借22B的激活参数，实现了235B的总参数量，并在编程、数学推理等基准测试中表现出色，超越了全球多个顶尖模型。

Qwen3系列的核心创新在于其双系统推理架构。面对复杂的数学证明、代码生成等任务时，模型会启动“慢思考”深度推理模块，支持高达38K token的动态思考预算，进行多步骤逻辑链分析。而在日常对话场景下，模型则以“快思考”模式运行，仅需激活20%的参数，从而实现了60%的响应速度提升和40%的算力消耗降低。

Qwen3系列模型的后训练流程设计围绕两大核心目标：一是“思考控制”，通过集成“非思考”与“思考”两种模式，用户可以根据需求灵活选择模型是否进行推理，并通过指定token预算来控制思考深度；二是“慢思考”，旨在简化和优化轻量级模型的后训练过程，借助大规模模型的知识，大幅降低构建小规模模型所需的计算成本和工作量。

在性能评测方面，旗舰模型Qwen3-235B-A22B表现出色。在数学推理的AIME25奥数测评中，该模型获得了81.5分的高分，刷新了开源模型的纪录，远超DeepSeek-R1等顶尖模型。在代码生成的LiveCodeBench评测中，Qwen3-235B-A22B同样表现出色，得分超过70分，超越了Grok-3-Beta和DeepSeek-R1等主流模型。

Qwen3系列模型还支持跨模态任务，集成了视觉（Qwen3-VL）和音频（Qwen3-Audio）模块，能够应用于医学影像分析等领域。在硬件与效率优化方面，MoE模型采用动态激活专家策略，仅需4张H20加速卡便能实现235B旗舰模型的部署。Qwen3系列模型在参数效率、推理成本、多语言支持及AI Agent开发等多个维度均展现出显著优势。

Qwen3-235B-A22B于今年5月6日成功登顶国际权威大模型测评榜LiveBench开源大模型性能的榜首，进一步证明了其卓越的性能和实力。Qwen3系列模型通过混合推理架构与高效训练策略，树立了开源模型的新标杆，正在逐步缩小与顶尖闭源产品的差距。

举报 0收藏 0打赏 0评论 0

更多>同类资讯

阿里Qwen深度研究实测：AI助理能否帮你高效“吃瓜”写报告？

相比于深度思考和深度搜索，深度研究是大模型使用的更高阶阶段，工作量更大，带来的效率提升更明显，对应的对模型综合能力的要求也更高。Qwen深度研究在规划之前，第一时间问了我三个问题，以确定报告范围。在此之后…

05-15

阿里巴巴重磅！通义万相Wan2.1-VACE视频生成编辑模型全面开源

05-15

腾讯2025年Q1财报：AI投入大增，GPU储备充足，未来模型训练无忧？

05-15

OpenAI首席科学家：AI本十年末或实现经济影响，今年将自主生成软件

05-14

日本气象厅新动向：AI将助力天气预报，精确度能否一飞冲天？

05-14

小成本大作为！Fastino任务特定语言模型超越GPT-4o，延迟狂降99倍

在收费模式上，尽管是针对企业而非消费者，但Fastino没有采用目前AI模型公司主流的以用量定价（例如GPT-4o的输入价格为2.5美元/百万tokens，输出价格为10美元/百万tokens），而是采用了…

05-14

阶跃星辰Step1X-3D大模型开源，赋能3D内容创作新高度

05-14

TikTok AI新玩法：静态照片秒变生动短视频

05-14

腾讯一季度研发投入近190亿，AI战略布局再提速！

05-14

AI浪潮下，新华三如何以自我进化引领产业智能化变革？

目前，新华三在AI领域正聚焦于两大战略：即通过“AI in ALL”，增强算力与联接的协同效应；同时，加速“AI for ALL”，以AI技术、产品和解决方案，赋能百行百业的智能化变革，与产业参与者一道，通…

05-14

即梦AI登顶，张楠能否借此重回字节权力核心？

两款产品数据量上的差距，一定程度上反映了字节和快手对视频生成产品的不同策略：即梦AI更倾向发展普通用户，优先追求用户扩张；可灵AI则更重视专业用户的渗透，优先追求收入增长。产品功能趋同、月活用户数更高的即梦…

05-14

腾讯一季度AI战略加速，275亿资本开支开启新增长引擎

05-14

AI手机竞赛白热化，品牌如何跨越成本与功能挑战？

05-14

加州律所AI造假，法官严惩：3.1万美元罚款警示行业乱象

05-14

谷歌AI同事即将亮相，软件开发将迎来“同事级”助手？

外媒TheInformation在今年1月曾首次报道，OpenAI正开发一款面向高级软件工程师的AI工具A-SWE，旨在协助处理更复杂的编程任务。如果谷歌真的率先推出其AI编程代理工具，那么在最新Gem…

05-14

点击查看更多 +

全站最新

理想汽车布局AI智能眼镜？招募人才动作引发热议

理想汽车布局AI智能眼镜？招募人才动作引发热议

红旗H5 PHEV长途试驾：超级混动魅力，银川至延安一路畅享

红旗H5 PHEV长途试驾：超级混动魅力，银川至延安一路畅享

沃尔沃S90换新颜，XC90设计加持，能否成为夏日汽车圈新宠？

沃尔沃S90换新颜，XC90设计加持，能否成为夏日汽车圈新宠？

新能源车隐藏式门把手安全问题引关注，标准制定在即

新能源车隐藏式门把手安全问题引关注，标准制定在即

别克GL8陆尚插混新上市，续航1420公里，30万内能否称霸MPV市场？

别克GL8陆尚插混新上市，续航1420公里，30万内能否称霸MPV市场？

宇宙终结倒计时：科学家预测10^78年后将迎来热寂，比预期大幅提前！

宇宙终结倒计时：科学家预测10^78年后将迎来热寂，比预期大幅提前！

热门内容

夸克AI新升级：深度搜索赋能，信息获取更高效智能
英伟达全球总部或将落户中国台湾，黄仁勋下周宣布这一重大决定？
ChatGPT喊你名字了？用户反应不一，个性化尝试遭遇“恐怖谷”
夸克AI新升级“深度搜索”，解锁高效获取信息新技能
蚂蚁集团慷慨分红，单季净利达136亿，阿里持股33%共享成果
教育部新规：学生禁直接复制AI作业，强化独立思考与批判性思维
通义千问3重磅登场！全球顶尖开源模型，通义App与网页版等你来体验
中国首部规范AI气象服务规章6月施行，气象领域将迎来新变革！
小米5月下旬新品爆发：手机平板眼镜手表，你期待哪一款？
苹果新款Apple TV 4K即将发布，四大升级能否重塑智能客厅体验？
小米16曝光：或将新增多功能按键，轻薄机身年底亮相？
360纳米AI新推MCP万能箱，打造个性化智能体提升效率
教育部新规：中小学分阶段用AI，严禁复制答案强化独立思考
华为HDC2025开发者大会6月来袭，早鸟票明日开抢，你准备好了吗？
苹果高管预警：AI发展迅猛，iPhone未来十年或被淘汰？

本栏最新

阿里巴巴重磅！通义万相Wan2.1-VACE视频生成编辑模型全面开源

阿里巴巴重磅！通义万相Wan2.1-VACE视频生成编辑模型全面开源

腾讯2025年Q1财报：AI投入大增，GPU储备充足，未来模型训练无忧？

腾讯2025年Q1财报：AI投入大增，GPU储备充足，未来模型训练无忧？

OpenAI首席科学家：AI本十年末或实现经济影响，今年将自主生成软件

OpenAI首席科学家：AI本十年末或实现经济影响，今年将自主生成软件

日本气象厅新动向：AI将助力天气预报，精确度能否一飞冲天？

日本气象厅新动向：AI将助力天气预报，精确度能否一飞冲天？

小成本大作为！Fastino任务特定语言模型超越GPT-4o，延迟狂降99倍

小成本大作为！Fastino任务特定语言模型超越GPT-4o，延迟狂降99倍

阶跃星辰Step1X-3D大模型开源，赋能3D内容创作新高度

阶跃星辰Step1X-3D大模型开源，赋能3D内容创作新高度

本文链接：http://www.28at.com/showinfo-45-12861-0.html阿里Qwen3大模型登顶开源榜首，235B参数展现强劲实力

声明：本网页内容旨在传播知识，不代表本站观点，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

显示全文

最新热点

Copyright © 2019-2023 天津谷骐科技有限公司版权所有
津ICP备18001702号