通义DeepResearch重磅登场:性能比肩海外旗舰,模型框架方案全面开源共享
2025-09-19 18:01:37 AI 54观看
摘要人工智能领域迎来重要突破,通义DeepResearch正式开源发布,标志着AI研究能力从“对话交互”向“深度探索”的跨越式发展。该模型在Humanity's Last Exam、BrowseComp、GAIA等国际权威深度研究基准测试中均取得最优成绩,综

人工智能领域迎来重要突破,通义DeepResearch正式开源发布,标志着AI研究能力从“对话交互”向“深度探索”的跨越式发展。该模型在Humanity's Last Exam、BrowseComp、GAIA等国际权威深度研究基准测试中均取得最优成绩,综合性能与海外旗舰模型持平甚至超越,同时以完全开源的方式提供模型、框架及解决方案。J6P28资讯网——每日最新资讯28at.com

针对海外闭源模型使用成本高、调用受限等问题,研发团队通过创新技术路径实现突破。30B参数规模的tongyi DeepResearch在保持轻量化的同时,通过多阶段数据策略和强化学习优化,在复杂推理任务中展现出显著优势。其核心技术覆盖数据合成、增量预训练、有监督微调及强化学习全流程,形成端到端的智能体训练范式。J6P28资讯网——每日最新资讯28at.com

数据构建方面,团队开发出全自动化合成方案。通过知识图谱随机游走、表格数据融合等技术,从真实网站提取结构化信息,并设计“原子操作”系统提升问题复杂度。特别在决策动作合成中,将多步骤轨迹重构为决策过程,有效增强模型规划能力。该方案生成的“博士级”研究问题,可模拟多学科交叉推理场景,推动模型能力逼近人类专家水平。J6P28资讯网——每日最新资讯28at.com

模型架构创新包含双重推理模式:标准ReAct模式支持128K长上下文交互,通过“思考-行动-观察”循环处理常规任务;深度模式(Heavy Mode)则采用IterResearch范式,将复杂任务分解为多个研究轮次。每轮仅保留关键信息构建精简工作空间,通过“综合与重构”迭代保持认知焦点,避免传统方法中的信息过载问题。团队还提出Research-Synthesis框架,允许多智能体并行探索后整合结论,显著提升答案准确性。J6P28资讯网——每日最新资讯28at.com

训练体系实现全链路革新,从Agentic持续预训练(CPT)到拒绝微调(RFT)再到强化学习(RL),形成闭环优化系统。在RL阶段,团队基于GRPO算法进行定制优化,采用on-policy训练范式确保学习信号与模型能力精准匹配。通过token级策略梯度损失、留一法优势估计等技术,有效降低训练方差。针对负样本干扰问题,开发选择性过滤机制,结合大批量训练维持监督信号稳定性。J6P28资讯网——每日最新资讯28at.com

基础设施层面构建三大支撑系统:仿真训练环境利用离线维基百科和自定义工具套件,降低对实时Web API的依赖;稳定工具沙盒通过缓存、重试和饱和响应机制,确保工具调用的可靠性;自动数据管理系统实现训练动态指导下的实时优化,形成数据生成与模型训练的正向循环。异步强化学习框架支持多智能体并行交互,显著提升训练效率。J6P28资讯网——每日最新资讯28at.com

技术落地已产生实际价值。与高德合作的出行智能体“高德小德”,在地图导航和本地生活场景中实现复杂查询的垂类应用,成为高德V16版本的核心功能。法律领域推出的“通义法睿”智能体,集成案例检索、合同审查、文书起草等功能,通过迭代规划技术实现多步推理,在答案质量、案例引用、法条匹配等维度达到行业领先水平。J6P28资讯网——每日最新资讯28at.com

研发团队同步发布六篇技术报告,详细阐述数据合成策略、强化学习优化、多智能体协作等关键技术。开源社区已上线30B参数规模的tongyi DeepResearch模型,配套提供框架代码和训练方案。此前半年间,团队保持每月发布技术报告的节奏,持续推动深度研究智能体领域的技术演进。J6P28资讯网——每日最新资讯28at.com

   更多>同类资讯宇树科技杜鑫峰:机器人从文娱到工业,在电网储能等场景展身手09-18DeepSeek发布严正声明:警惕不法分子冒用名义开展“算力租赁”“融资”诈骗09-18DeepSeek登《Nature》封面:梁文锋团队以低成本创新,开启AI推理革命新篇09-18华为徐直军:Atlas 950超节点算力卓越,多项指标远超英伟达同期产品09-18蓝思科技携手Rokid打造智能眼镜,亮相东博会展现科技文化融合魅力由蓝思科技与Rokid共同开发的Rokid Glasses智能眼镜作为大会指定贵宾礼品正式亮相,展现了中国智能制造的技术水平与创新实力。产品采用衍射光波导显示技术,在保持高透光率的同时实现高清晰度显示,并搭载…09-18类脑研究新突破:解锁大脑奥秘,推动人工智能迈向“自我思考”时代复旦大学类脑智能科学与技术研究院院长冯建峰曾介绍:“现在的人工智能,仍停滞于机器的概念。在这里,冯建峰和诸多科研团队正在破解一个个“脑奥秘”:比如,研究发现,人脑前额叶和枕叶区的灰质体积越小,多动症的症状越严…09-18技术革新与政策助力双轮驱动:仓储机器人重塑物流产业新生态同期发布的《“十四五”机器人产业发展规划》,更是明确将提高产业创新能力、夯实产业发展基础、增加高端产品供给等作为主要任务;在“机器人+”应用行动中,提出要深耕仓储物流等重点行业的应用;在机器人创新产品发展行…09-18宇树科技杜鑫峰:机器人“进厂打工”成趋势,数据采集难题待解9 月 18 日消息,据每日经济新闻今天报道,2025 世界储能大会今天在宁德开幕,其中宇树科技副总经理杜鑫峰在大会上发表演讲。 杜鑫峰表示,宇树科技的机器人现在广泛应用于文娱表演方面,同时在工业巡…09-18北自科技携手星动纪元:人形机器人开启智能物流新时代探索之旅星动纪元有清华技术基因,陈建宇教授团队在研发上实力强劲;北自科技则具备场景落地能力,双方结合能将技术与应用深度融合,实现人形机器人技术在物流工业场景中的落地。 陈建宇:星动纪元与北自科技的技术协同,将探索和挖…09-18华为发布灵衢互联协议与系列超节点,引领AI算力基础设施新变革09-18ICPC总决赛AI大放异彩!GPT-5组合满分夺冠,人类赛场角逐第三席位09-18微盟集团获2亿美金长线投资,聚焦AI研发与出海,CEO展望全球科技新篇章09-18DeepSeek登《Nature》封面引关注 梁文锋带队回应争议 开启AI推理新征程09-18华为徐直军:Atlas 950超节点算力强劲,多项指标远超英伟达同类产品09-18​我国科研团队攻克难关 研发“神经蠕虫”电极开启生物电子接口新范式​​我国科研团队攻克难关 研发“神经蠕虫”电极开启生物电子接口新范式​潍坊青州云门山景区:重载无人机助力施工 突破地形难题提速增效潍坊青州云门山景区:重载无人机助力施工 突破地形难题提速增效技术革新与政策助力双轮驱动:仓储机器人重塑物流产业新生态技术革新与政策助力双轮驱动:仓储机器人重塑物流产业新生态宇树科技杜鑫峰:机器人“进厂打工”成趋势,数据采集难题待解宇树科技杜鑫峰:机器人“进厂打工”成趋势,数据采集难题待解北自科技携手星动纪元:人形机器人开启智能物流新时代探索之旅北自科技携手星动纪元:人形机器人开启智能物流新时代探索之旅南京浦口中专学校新设无人机专业,产教融合助学子逐梦低空蓝天南京浦口中专学校新设无人机专业,产教融合助学子逐梦低空蓝天热门内容
  • 热度攀升!千亿科技龙头频获机构调研,业务增长透露哪些行业新动向?
  • 苹果加速AI布局,或收购两家法国AI初创企业
  • DeepSeek V3.1大模型升级,适配国产新芯片,性能显著提升
  • 苹果秋季发布会亮相iPhone 17系列:"史上最薄"Air登场,Pro Max 2TB版定价17999元
  • ​小米16系列或提前登场,首发骁龙8 Elite Gen5,9月机圈大战一触即发​
  • 国金证券:A股第三轮重估脚步临近,三类资产投资方向值得关注
  • 苹果加速布局中国市场!Apple Intelligence和新版Siri或年底至明年上线
  • 苹果AI布局加速,或将斥巨资收购欧洲两大AI初创企业
  • 红米Note15系列前瞻:7s芯片、7000mAh大电池,防水新标杆即将登场
  • WAVE SUMMIT大会新动态:文心大模型X1.1上线,多项能力显著跃升
  • 华为智能手表登顶全球,苹果需直面挑战求变革
  • 科创板AI基金8月22日净值飙升7.79%,重仓股表现抢眼
  • ‍字节跳动千人芯片团队架构调整,转至新加坡子公司Picoheart引关注‍
  • vivo X300系列新机入网:首发LYT-828+2亿像素,卫通版支持北斗卫星短信
  • OpenAI冲刺5000亿估值,GPT-5遇冷:资本狂欢与技术瓶颈的碰撞
本栏最新北自科技携手星动纪元:人形机器人开启智能物流新时代探索之旅北自科技携手星动纪元:人形机器人开启智能物流新时代探索之旅华为发布灵衢互联协议与系列超节点,引领AI算力基础设施新变革华为发布灵衢互联协议与系列超节点,引领AI算力基础设施新变革DeepSeek-R1论文登Nature封面:AI大模型研究迈向科学严谨新阶段DeepSeek-R1论文登Nature封面:AI大模型研究迈向科学严谨新阶段华为发布《AIDC机房参考设计白皮书》,为AI算力设施建设指明新方向华为发布《AIDC机房参考设计白皮书》,为AI算力设施建设指明新方向华为坤灵“4+10+N”方案出炉,一站式助力中小企业迈向智能世界华为坤灵“4+10+N”方案出炉,一站式助力中小企业迈向智能世界

本文链接:http://www.28at.com/showinfo-45-27815-0.html通义DeepResearch重磅登场:性能比肩海外旗舰,模型框架方案全面开源共享

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:平头哥AI芯片PPU登上《新闻联播》,亮相次日阿里港股市值达3.02万亿港元

下一篇:宇树科技杜鑫峰:机器人从文娱到工业,在电网储能等场景展身手

最新热点