人工智能领域迎来重要突破,通义DeepResearch正式开源发布,标志着AI研究能力从“对话交互”向“深度探索”的跨越式发展。该模型在Humanity's Last Exam、BrowseComp、GAIA等国际权威深度研究基准测试中均取得最优成绩,综合性能与海外旗舰模型持平甚至超越,同时以完全开源的方式提供模型、框架及解决方案。
针对海外闭源模型使用成本高、调用受限等问题,研发团队通过创新技术路径实现突破。30B参数规模的tongyi DeepResearch在保持轻量化的同时,通过多阶段数据策略和强化学习优化,在复杂推理任务中展现出显著优势。其核心技术覆盖数据合成、增量预训练、有监督微调及强化学习全流程,形成端到端的智能体训练范式。
数据构建方面,团队开发出全自动化合成方案。通过知识图谱随机游走、表格数据融合等技术,从真实网站提取结构化信息,并设计“原子操作”系统提升问题复杂度。特别在决策动作合成中,将多步骤轨迹重构为决策过程,有效增强模型规划能力。该方案生成的“博士级”研究问题,可模拟多学科交叉推理场景,推动模型能力逼近人类专家水平。
模型架构创新包含双重推理模式:标准ReAct模式支持128K长上下文交互,通过“思考-行动-观察”循环处理常规任务;深度模式(Heavy Mode)则采用IterResearch范式,将复杂任务分解为多个研究轮次。每轮仅保留关键信息构建精简工作空间,通过“综合与重构”迭代保持认知焦点,避免传统方法中的信息过载问题。团队还提出Research-Synthesis框架,允许多智能体并行探索后整合结论,显著提升答案准确性。
训练体系实现全链路革新,从Agentic持续预训练(CPT)到拒绝微调(RFT)再到强化学习(RL),形成闭环优化系统。在RL阶段,团队基于GRPO算法进行定制优化,采用on-policy训练范式确保学习信号与模型能力精准匹配。通过token级策略梯度损失、留一法优势估计等技术,有效降低训练方差。针对负样本干扰问题,开发选择性过滤机制,结合大批量训练维持监督信号稳定性。
基础设施层面构建三大支撑系统:仿真训练环境利用离线维基百科和自定义工具套件,降低对实时Web API的依赖;稳定工具沙盒通过缓存、重试和饱和响应机制,确保工具调用的可靠性;自动数据管理系统实现训练动态指导下的实时优化,形成数据生成与模型训练的正向循环。异步强化学习框架支持多智能体并行交互,显著提升训练效率。
技术落地已产生实际价值。与高德合作的出行智能体“高德小德”,在地图导航和本地生活场景中实现复杂查询的垂类应用,成为高德V16版本的核心功能。法律领域推出的“通义法睿”智能体,集成案例检索、合同审查、文书起草等功能,通过迭代规划技术实现多步推理,在答案质量、案例引用、法条匹配等维度达到行业领先水平。
研发团队同步发布六篇技术报告,详细阐述数据合成策略、强化学习优化、多智能体协作等关键技术。开源社区已上线30B参数规模的tongyi DeepResearch模型,配套提供框架代码和训练方案。此前半年间,团队保持每月发布技术报告的节奏,持续推动深度研究智能体领域的技术演进。
更多>同类资讯
宇树科技杜鑫峰:机器人从文娱到工业,在电网储能等场景展身手09-18
DeepSeek发布严正声明:警惕不法分子冒用名义开展“算力租赁”“融资”诈骗09-18
DeepSeek登《Nature》封面:梁文锋团队以低成本创新,开启AI推理革命新篇09-18
华为徐直军:Atlas 950超节点算力卓越,多项指标远超英伟达同期产品09-18
蓝思科技携手Rokid打造智能眼镜,亮相东博会展现科技文化融合魅力由蓝思科技与Rokid共同开发的Rokid Glasses智能眼镜作为大会指定贵宾礼品正式亮相,展现了中国智能制造的技术水平与创新实力。产品采用衍射光波导显示技术,在保持高透光率的同时实现高清晰度显示,并搭载…09-18
类脑研究新突破:解锁大脑奥秘,推动人工智能迈向“自我思考”时代复旦大学类脑智能科学与技术研究院院长冯建峰曾介绍:“现在的人工智能,仍停滞于机器的概念。在这里,冯建峰和诸多科研团队正在破解一个个“脑奥秘”:比如,研究发现,人脑前额叶和枕叶区的灰质体积越小,多动症的症状越严…09-18
技术革新与政策助力双轮驱动:仓储机器人重塑物流产业新生态同期发布的《“十四五”机器人产业发展规划》,更是明确将提高产业创新能力、夯实产业发展基础、增加高端产品供给等作为主要任务;在“机器人+”应用行动中,提出要深耕仓储物流等重点行业的应用;在机器人创新产品发展行…09-18
宇树科技杜鑫峰:机器人“进厂打工”成趋势,数据采集难题待解9 月 18 日消息,据每日经济新闻今天报道,2025 世界储能大会今天在宁德开幕,其中宇树科技副总经理杜鑫峰在大会上发表演讲。 杜鑫峰表示,宇树科技的机器人现在广泛应用于文娱表演方面,同时在工业巡…09-18
北自科技携手星动纪元:人形机器人开启智能物流新时代探索之旅星动纪元有清华技术基因,陈建宇教授团队在研发上实力强劲;北自科技则具备场景落地能力,双方结合能将技术与应用深度融合,实现人形机器人技术在物流工业场景中的落地。 陈建宇:星动纪元与北自科技的技术协同,将探索和挖…09-18
华为发布灵衢互联协议与系列超节点,引领AI算力基础设施新变革09-18ICPC总决赛AI大放异彩!GPT-5组合满分夺冠,人类赛场角逐第三席位09-18微盟集团获2亿美金长线投资,聚焦AI研发与出海,CEO展望全球科技新篇章09-18DeepSeek登《Nature》封面引关注 梁文锋带队回应争议 开启AI推理新征程09-18华为徐直军:Atlas 950超节点算力强劲,多项指标远超英伟达同类产品09-18
我国科研团队攻克难关 研发“神经蠕虫”电极开启生物电子接口新范式
潍坊青州云门山景区:重载无人机助力施工 突破地形难题提速增效
技术革新与政策助力双轮驱动:仓储机器人重塑物流产业新生态
宇树科技杜鑫峰:机器人“进厂打工”成趋势,数据采集难题待解
北自科技携手星动纪元:人形机器人开启智能物流新时代探索之旅
南京浦口中专学校新设无人机专业,产教融合助学子逐梦低空蓝天热门内容
北自科技携手星动纪元:人形机器人开启智能物流新时代探索之旅
华为发布灵衢互联协议与系列超节点,引领AI算力基础设施新变革
DeepSeek-R1论文登Nature封面:AI大模型研究迈向科学严谨新阶段
华为发布《AIDC机房参考设计白皮书》,为AI算力设施建设指明新方向
华为坤灵“4+10+N”方案出炉,一站式助力中小企业迈向智能世界
本文链接:http://www.28at.com/showinfo-45-27815-0.html通义DeepResearch重磅登场:性能比肩海外旗舰,模型框架方案全面开源共享
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。