中国大模型DeepSeek首登Nature封面,R1训练成本仅约208万引关注
2025-09-19 17:57:33 AI 23观看
摘要中国AI领域迎来历史性时刻——DeepSeek公司凭借其R1大模型研究成果,成为首家登上《自然》杂志封面的中国AI企业。这一突破性成就标志着中国在基础大模型研究领域正式跻身全球顶尖行列,此前仅有DeepMind凭借AlphaGo和Alp

中国AI领域迎来历史性时刻——DeepSeek公司凭借其R1大模型研究成果,成为首家登上《自然》杂志封面的中国AI企业。这一突破性成就标志着中国在基础大模型研究领域正式跻身全球顶尖行列,此前仅有DeepMind凭借AlphaGo和AlphaFold获得过同等殊荣。GBt28资讯网——每日最新资讯28at.com

最新披露的Nature版本论文首次公开了R1模型的训练成本细节:该660亿参数规模的模型仅耗资29.4万美元(约合人民币208万元)完成训练。研究团队使用512张H800 GPU,R1-Zero训练耗时198小时,R1训练耗时80小时,按每GPU小时2美元的租赁价格计算得出总成本。这一数据与行业动辄千万美元级的训练投入形成鲜明对比,年初发布时即在美股市场引发强烈震动。GBt28资讯网——每日最新资讯28at.com

在数据构建方面,研究团队彻底驳斥了"模型输出循环输入"的质疑。公开的补充材料显示,R1训练数据集包含五大类别:数学数据集收录2.6万道定量推理题(含竞赛题和考试题),代码数据集包含1.7万道算法竞赛题和8千道代码修复问题,STEM数据集涵盖2.2万道物理、化学、生物选择题,逻辑数据集包含1.5万道真实与合成问题,通用数据集则包含6.6万道覆盖创意写作、文本编辑等场景的评估题。GBt28资讯网——每日最新资讯28at.com

安全性评估体系成为另一大亮点。研究团队构建了多维评估框架:包括官方服务风险控制系统、六个公开安全基准的横向对比、内部安全测试集的分类学研究、多语言安全评估以及越狱攻击鲁棒性测试。评估结果显示,R1模型基础安全水平与GPT-4o相当,通过配套风险控制系统可进一步提升防护能力。GBt28资讯网——每日最新资讯28at.com

技术实现路径方面,研究团队采用纯强化学习框架突破传统依赖。以DeepSeek-V3-Base为基础模型,通过GRPO(群体相对策略优化)算法进行数千步强化训练,使R1-Zero在AIME 2024数学基准测试中pass@1分数从15.6%跃升至71.0%,经多数表决后更达86.7%,性能媲美OpenAI o1模型。后续推出的R1模型通过冷启动数据、拒绝采样、监督微调等多阶段优化,解决了初始版本的可读性和语言混合问题。GBt28资讯网——每日最新资讯28at.com

学术影响力持续发酵。截至当前统计,该研究在谷歌学术已被引用3596次,HuggingFace平台开源模型下载量突破1090万次(居开源模型首位),GitHub获得9.11万颗星标。评审专家、Hugging Face工程师Lewis Tunstall特别指出,这是首个通过同行评审的大型语言模型研究,为学术界树立了重要标杆。俄亥俄州立大学Huan Sun教授评价称,该研究自发布以来已实质性影响全球大模型强化学习研究方向。GBt28资讯网——每日最新资讯28at.com

开源生态建设展现中国AI新范式。研究团队在HuggingFace平台全面公开了R1和R1-Zero的模型权重,同步开源基于Qwen2.5和Llama3架构的蒸馏模型。这种透明化研究模式获得国际学术界高度认可,论文特别强调的"推理模式迁移"技术,已证明可使Qwen2.5-32B等基础模型通过知识蒸馏获得显著性能提升。GBt28资讯网——每日最新资讯28at.com

   更多>同类资讯华为全联接大会2025启幕,发布全球最强算力超节点与集群中国经济网9月19日讯(记者 王惠绵)9月18日,华为全联接大会2025在上海启幕,华为副董事长、轮值董事长徐直军发表题为“以开创的超节点互联技术,引领AI基础设施新范式”的主题演讲,正式发布全球最强算力超节…09-19有鹿机器人+连合直租:以智能租赁模式,开启高端场景清洁新未来更关键的是,其“按有效清洁时长付费”的机制,直接将支付与效果绑定,避免了“设备闲置却仍在折旧”的浪费,尤其适合项目制或季节性波动明显的场景。 有鹿机器人与连合直租的组合,不仅提供了清洁问题的解决方案,更提供了…09-19第22届东博会AI专馆“科技盛宴”:透明屏、智能装备等展现区域合作新机遇AI透明屏产品运营经理 王晨:可以支持37种语种,它主要是为一些公共服务的窗口,比如说像机场,酒店,因为会有很多的外国游客,就可以完美地去解决沟通的问题。记者在现场注意到,除了带着产品来的展商,不少企业还把…09-19第22届东博会AI闪耀:数字智能体引路 机器人文创共绘合作新篇总台央视记者 张歆:这是一届由人工智能赋能的全新的中国—东盟博览会。今年中国—东盟博览会的人工智能专馆,这里也是今年首设的人工智能专馆,在这里展示了最先进的智能机器人以及AI解决方案。 总台央视记者 张歆…09-19俄罗斯2028年将发射轨道站首个舱段,为登月筑基并开发星际关键技术09-19寒武纪回应订单不实传闻:产品多行业部署,存货增长因云端备货09-19寒武纪2025上半年扭亏赚超10亿,备26亿存货布局云端,高管详解发展逻辑09-19华为全联接大会2025启幕,发布最强算力超节点集群,为AI发展注入强劲动力09-19小红书“重拳出击”打击虚假营销,筑牢真实社区生态防线09-19NVIDIA与Intel强强联手:50亿美元入股,共筑AI与PC新未来09-19华为全球联接大会2025发布重磅成果:最强算力超节点集群及昇腾芯片未来三年规划华为发布了最新超节点产品Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点,分别支持8192及15488张昇腾卡,在卡规模、总算力、内存容量、互联带宽等关键指标上全面领先,在未来…09-19DeepSeek-R1登《自然》封面:纯强化学习突破,引领大模型推理新方向训练过程中,DeepSeek-R1-Zero展现出令人惊叹的自我进化能力,学会了生成数百到数千个推理token,深入探索和完善思维过程,还发展出反思能力和探索不同解题方法的能力。先进行冷启动SFT,人工筛选高…09-19从“联接”到“智变”:新华三以智能工厂与数智平台赋能中国制造09-19三年半亏6亿,80后博士带队,国星宇航赴港IPO能否“冲上云霄”?09-19耶鲁大学打造MMVU测试:AI专业视频理解能力迎来“大考”09-19点击查看更多 +全站最新安科高新院智能化改造供排水系统:自动调控,动态可视,高效互联安科高新院智能化改造供排水系统:自动调控,动态可视,高效互联iPhone 17 Pro Max与16 Pro Max怎么选?性能影像价格全对比,助你挑出心头好iPhone 17 Pro Max与16 Pro Max怎么选?性能影像价格全对比,助你挑出心头好Meta智能眼镜革新:配神经腕带无声输入,欲挑战手机核心场景Meta智能眼镜革新:配神经腕带无声输入,欲挑战手机核心场景小米雷军年度演讲9月或启幕,17系列手机等新品将震撼登场小米雷军年度演讲9月或启幕,17系列手机等新品将震撼登场全应用实时2D转3D技术发布,INAIR开启随时随地沉浸式3D影音新体验全应用实时2D转3D技术发布,INAIR开启随时随地沉浸式3D影音新体验黔西农产品智能发货平台:打破壁垒降本增效 助推县域电商驶入快车道黔西农产品智能发货平台:打破壁垒降本增效 助推县域电商驶入快车道热门内容
  • 热度攀升!千亿科技龙头频获机构调研,业务增长透露哪些行业新动向?
  • 苹果加速AI布局,或收购两家法国AI初创企业
  • DeepSeek V3.1大模型升级,适配国产新芯片,性能显著提升
  • 苹果秋季发布会亮相iPhone 17系列:"史上最薄"Air登场,Pro Max 2TB版定价17999元
  • ​小米16系列或提前登场,首发骁龙8 Elite Gen5,9月机圈大战一触即发​
  • 国金证券:A股第三轮重估脚步临近,三类资产投资方向值得关注
  • 苹果加速布局中国市场!Apple Intelligence和新版Siri或年底至明年上线
  • 苹果AI布局加速,或将斥巨资收购欧洲两大AI初创企业
  • 红米Note15系列前瞻:7s芯片、7000mAh大电池,防水新标杆即将登场
  • WAVE SUMMIT大会新动态:文心大模型X1.1上线,多项能力显著跃升
  • 华为智能手表登顶全球,苹果需直面挑战求变革
  • ‍字节跳动千人芯片团队架构调整,转至新加坡子公司Picoheart引关注‍
  • 科创板AI基金8月22日净值飙升7.79%,重仓股表现抢眼
  • vivo X300系列新机入网:首发LYT-828+2亿像素,卫通版支持北斗卫星短信
  • 华为云重组风暴:多部门整合,聚焦AI领域引发关注
本栏最新第22届东博会AI闪耀:数字智能体引路 机器人文创共绘合作新篇第22届东博会AI闪耀:数字智能体引路 机器人文创共绘合作新篇华为全联接大会2025启幕,发布最强算力超节点集群,为AI发展注入强劲动力华为全联接大会2025启幕,发布最强算力超节点集群,为AI发展注入强劲动力NVIDIA与Intel强强联手:50亿美元入股,共筑AI与PC新未来NVIDIA与Intel强强联手:50亿美元入股,共筑AI与PC新未来华为全球联接大会2025发布重磅成果:最强算力超节点集群及昇腾芯片未来三年规划华为全球联接大会2025发布重磅成果:最强算力超节点集群及昇腾芯片未来三年规划DeepSeek-R1登《自然》封面:纯强化学习突破,引领大模型推理新方向DeepSeek-R1登《自然》封面:纯强化学习突破,引领大模型推理新方向从“联接”到“智变”:新华三以智能工厂与数智平台赋能中国制造从“联接”到“智变”:新华三以智能工厂与数智平台赋能中国制造

本文链接:http://www.28at.com/showinfo-45-27770-0.html中国大模型DeepSeek首登Nature封面,R1训练成本仅约208万引关注

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:​DeepSeek-R1模型研究登《自然》封面:AI推理能力获突破性进展​

下一篇:华为全联接大会2025启幕,发布全球最强算力超节点与集群

最新热点