通义DeepResearch重磅登场：性能比肩海外旗舰，模型框架方案全面开源共享-28资讯网—

通义DeepResearch重磅登场：性能比肩海外旗舰，模型框架方案全面开源共享

2025-09-19 18:01:37 AI 101观看

摘要人工智能领域迎来重要突破，通义DeepResearch正式开源发布，标志着AI研究能力从“对话交互”向“深度探索”的跨越式发展。该模型在Humanity's Last Exam、BrowseComp、GAIA等国际权威深度研究基准测试中均取得最优成绩，综

人工智能领域迎来重要突破，通义DeepResearch正式开源发布，标志着AI研究能力从“对话交互”向“深度探索”的跨越式发展。该模型在Humanity's Last Exam、BrowseComp、GAIA等国际权威深度研究基准测试中均取得最优成绩，综合性能与海外旗舰模型持平甚至超越，同时以完全开源的方式提供模型、框架及解决方案。

针对海外闭源模型使用成本高、调用受限等问题，研发团队通过创新技术路径实现突破。30B参数规模的tongyi DeepResearch在保持轻量化的同时，通过多阶段数据策略和强化学习优化，在复杂推理任务中展现出显著优势。其核心技术覆盖数据合成、增量预训练、有监督微调及强化学习全流程，形成端到端的智能体训练范式。

数据构建方面，团队开发出全自动化合成方案。通过知识图谱随机游走、表格数据融合等技术，从真实网站提取结构化信息，并设计“原子操作”系统提升问题复杂度。特别在决策动作合成中，将多步骤轨迹重构为决策过程，有效增强模型规划能力。该方案生成的“博士级”研究问题，可模拟多学科交叉推理场景，推动模型能力逼近人类专家水平。

模型架构创新包含双重推理模式：标准ReAct模式支持128K长上下文交互，通过“思考-行动-观察”循环处理常规任务；深度模式（Heavy Mode）则采用IterResearch范式，将复杂任务分解为多个研究轮次。每轮仅保留关键信息构建精简工作空间，通过“综合与重构”迭代保持认知焦点，避免传统方法中的信息过载问题。团队还提出Research-Synthesis框架，允许多智能体并行探索后整合结论，显著提升答案准确性。

训练体系实现全链路革新，从Agentic持续预训练（CPT）到拒绝微调（RFT）再到强化学习（RL），形成闭环优化系统。在RL阶段，团队基于GRPO算法进行定制优化，采用on-policy训练范式确保学习信号与模型能力精准匹配。通过token级策略梯度损失、留一法优势估计等技术，有效降低训练方差。针对负样本干扰问题，开发选择性过滤机制，结合大批量训练维持监督信号稳定性。

基础设施层面构建三大支撑系统：仿真训练环境利用离线维基百科和自定义工具套件，降低对实时Web API的依赖；稳定工具沙盒通过缓存、重试和饱和响应机制，确保工具调用的可靠性；自动数据管理系统实现训练动态指导下的实时优化，形成数据生成与模型训练的正向循环。异步强化学习框架支持多智能体并行交互，显著提升训练效率。

技术落地已产生实际价值。与高德合作的出行智能体“高德小德”，在地图导航和本地生活场景中实现复杂查询的垂类应用，成为高德V16版本的核心功能。法律领域推出的“通义法睿”智能体，集成案例检索、合同审查、文书起草等功能，通过迭代规划技术实现多步推理，在答案质量、案例引用、法条匹配等维度达到行业领先水平。

研发团队同步发布六篇技术报告，详细阐述数据合成策略、强化学习优化、多智能体协作等关键技术。开源社区已上线30B参数规模的tongyi DeepResearch模型，配套提供框架代码和训练方案。此前半年间，团队保持每月发布技术报告的节奏，持续推动深度研究智能体领域的技术演进。

更多>同类资讯

宇树科技杜鑫峰：机器人从文娱到工业，在电网储能等场景展身手09-18

DeepSeek发布严正声明：警惕不法分子冒用名义开展“算力租赁”“融资”诈骗09-18

DeepSeek登《Nature》封面：梁文锋团队以低成本创新，开启AI推理革命新篇09-18

华为徐直军：Atlas 950超节点算力卓越，多项指标远超英伟达同期产品09-18

蓝思科技携手Rokid打造智能眼镜，亮相东博会展现科技文化融合魅力由蓝思科技与Rokid共同开发的Rokid Glasses智能眼镜作为大会指定贵宾礼品正式亮相，展现了中国智能制造的技术水平与创新实力。产品采用衍射光波导显示技术，在保持高透光率的同时实现高清晰度显示，并搭载…09-18

类脑研究新突破：解锁大脑奥秘，推动人工智能迈向“自我思考”时代复旦大学类脑智能科学与技术研究院院长冯建峰曾介绍：“现在的人工智能，仍停滞于机器的概念。在这里，冯建峰和诸多科研团队正在破解一个个“脑奥秘”：比如，研究发现，人脑前额叶和枕叶区的灰质体积越小，多动症的症状越严…09-18

技术革新与政策助力双轮驱动：仓储机器人重塑物流产业新生态同期发布的《“十四五”机器人产业发展规划》，更是明确将提高产业创新能力、夯实产业发展基础、增加高端产品供给等作为主要任务；在“机器人+”应用行动中，提出要深耕仓储物流等重点行业的应用；在机器人创新产品发展行…09-18

宇树科技杜鑫峰：机器人“进厂打工”成趋势，数据采集难题待解9 月 18 日消息，据每日经济新闻今天报道，2025 世界储能大会今天在宁德开幕，其中宇树科技副总经理杜鑫峰在大会上发表演讲。杜鑫峰表示，宇树科技的机器人现在广泛应用于文娱表演方面，同时在工业巡…09-18

北自科技携手星动纪元：人形机器人开启智能物流新时代探索之旅星动纪元有清华技术基因，陈建宇教授团队在研发上实力强劲；北自科技则具备场景落地能力，双方结合能将技术与应用深度融合，实现人形机器人技术在物流工业场景中的落地。陈建宇：星动纪元与北自科技的技术协同，将探索和挖…09-18

华为发布灵衢互联协议与系列超节点，引领AI算力基础设施新变革09-18ICPC总决赛AI大放异彩！GPT-5组合满分夺冠，人类赛场角逐第三席位09-18微盟集团获2亿美金长线投资，聚焦AI研发与出海，CEO展望全球科技新篇章09-18DeepSeek登《Nature》封面引关注梁文锋带队回应争议开启AI推理新征程09-18华为徐直军：Atlas 950超节点算力强劲，多项指标远超英伟达同类产品09-18 我国科研团队攻克难关研发“神经蠕虫”电极开启生物电子接口新范式