英伟达Blackwell DGX系统刷新DeepSeek推理性能世界纪录
2025-03-19 09:42:20 AI 29观看
摘要英伟达在NVIDIA GTC 2025大会上宣布,其最新推出的NVIDIA Blackwell DGX系统在DeepSeek-R1大模型推理性能上创造了世界纪录。这一突破性进展标志着英伟达在人工智能推理技术上的又一次飞跃。据悉,在单个搭载八块Blackwel

英伟达在NVIDIA GTC 2025大会上宣布,其最新推出的NVIDIA Blackwell DGX系统在DeepSeek-R1大模型推理性能上创造了世界纪录。这一突破性进展标志着英伟达在人工智能推理技术上的又一次飞跃。Hxn28资讯网——每日最新资讯28at.com

据悉,在单个搭载八块Blackwell GPU的DGX系统上,DeepSeek-R1模型以6710亿参数的满血状态运行,实现了每用户每秒超过250 token的响应速度,系统整体吞吐量更是突破了每秒3万token的大关。这一数据不仅彰显了Blackwell GPU的强大性能,也展示了英伟达在优化大型语言模型推理方面的深厚实力。Hxn28资讯网——每日最新资讯28at.com

Hxn28资讯网——每日最新资讯28at.com

英伟达强调,随着Blackwell Ultra GPU和Blackwell GPU的不断升级,NVIDIA平台将继续在推理性能上实现新的突破。这一承诺不仅体现在硬件上,还体现在软件优化上。英伟达通过结合硬件和软件的力量,自2025年1月以来,成功将DeepSeek-R1 671B模型的吞吐量提高了约36倍。Hxn28资讯网——每日最新资讯28at.com

在会上,英伟达还展示了不同配置下的DGX系统性能。包括DGX B200(8块GPU)和DGX H200(8块GPU)在内的单节点配置,在采用TensorRT-LLM软件的最新内部版本进行测试时,展现了出色的推理性能。测试参数包括输入1024 token和输出2048 token,并发性达到最大。在计算精度上,B200采用了FP4精度,而H200则采用了FP8精度。Hxn28资讯网——每日最新资讯28at.com

Hxn28资讯网——每日最新资讯28at.com

英伟达还对比了Blackwell架构与Hopper架构在推理性能上的差异。结果显示,Blackwell架构与TensorRT软件相结合,可以显著提升推理性能。在DeepSeek-R1、Llama 3.1 405B和Llama 3.3 70B等模型上,使用FP4精度的DGX B200平台和DGX H200平台相比,推理吞吐量提高了3倍以上。Hxn28资讯网——每日最新资讯28at.com

Hxn28资讯网——每日最新资讯28at.com

英伟达还展示了不同数据集上DeepSeek-R1模型的精度表现。在FP4和FP8精度下,DeepSeek-R1模型在MMLUG、SM8K、AIME 2024、GPQA和DiamondMATH-500等数据集上的表现均十分出色。值得注意的是,在使用TensorRT Model Optimizer的FP4训练后量化(PTQ)技术时,DeepSeek-R1模型在不同数据集上的精度损失微乎其微,这进一步证明了英伟达在量化技术上的领先地位。Hxn28资讯网——每日最新资讯28at.com

Hxn28资讯网——每日最新资讯28at.com

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。通过不断的技术创新和优化,英伟达将继续为客户提供更高效、更准确的AI推理解决方案。Hxn28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
创维汽车2025战略:新产品新技术齐发力,加速冲刺全球新能源市场
创维汽车2025战略:新产品新技术齐发力,加速冲刺全球新能源市场
创维汽车全球经销商大会:新技术新产品引领新能源赛道新传奇
创维汽车全球经销商大会:新技术新产品引领新能源赛道新传奇
英伟达CEO黄仁勋:AI未来何方?详解英伟达战略与布局
英伟达CEO黄仁勋:AI未来何方?详解英伟达战略与布局
海螺AI升级!全新品牌MiniMax亮相,海螺视频专注AI视频领域
海螺AI升级!全新品牌MiniMax亮相,海螺视频专注AI视频领域
2025款昂科威S白金版来袭,豪华内饰与强劲动力能否带来新惊喜?
2025款昂科威S白金版来袭,豪华内饰与强劲动力能否带来新惊喜?
哈弗H5焕新上市,黑化套件加持,越野性能再升级,仅售14.78万元起
哈弗H5焕新上市,黑化套件加持,越野性能再升级,仅售14.78万元起
热门内容
  • 夸克AI搜索升级“深度思考”,纯净浏览器迎来智能新篇章!
  • 浙大发布“浙大先生”,深度融合智能体DeepSeek V3/R1全国高校共享!
  • 00后主播借AI工具DeepSeek,直播单日狂揽3.3亿销售额!
  • 夸克AI搜索升级“深度思考”,阿里自研模型加持,DeepSeek暂缺席
  • 微信生活服务添新成员,元宝App下载入口限时开放
  • 中国AI新突破!全球首款通用Agent产品Manus内测引热议
  • AI大模型时代,文科生将何去何从?
  • 马斯克xAI发布Grok-3,杭州才子吴宇怀领衔创始团队亮相
  • 百度PC端DeepSeek入口上线,1小时破千万用户尝鲜AI搜索新体验!
  • 夸克AI搜索新升级:开启“深度思考”,引领搜索行业AI新纪元
  • 阿里新夸克AI超级框上线,能否撼动腾讯元宝的AI入口地位?
  • 悟空浏览器牵手DeepSeek R1,抖音内容生态将迎新变化?
  • 夸克AI搜索新增“深度思考”,纯净浏览器变身智能提效神器!
  • 海淀AI新星硅基流动:亿元融资入局七千亿市场,未来可期?
  • 360携手华为,昇腾云赋能纳米AI,DeepSeek-R1模型算力再升级!
本栏最新
AMD潘晓明:携手伙伴加速中国AI PC生态,ISV合作伙伴将增至170家
AMD潘晓明:携手伙伴加速中国AI PC生态,ISV合作伙伴将增至170家
英伟达首发开源人形机器人GR00T N1,加速机器人开发新时代
英伟达首发开源人形机器人GR00T N1,加速机器人开发新时代
平湖童车:驶向全球市场的“小巨人”,如何续写新篇章?
平湖童车:驶向全球市场的“小巨人”,如何续写新篇章?
英伟达GTC大会:全球首款开源人形机器人GR00T N1震撼登场!
英伟达GTC大会:全球首款开源人形机器人GR00T N1震撼登场!
卓驭发布可个性化定制智驾方案GenDrive,年内将量产上车
卓驭发布可个性化定制智驾方案GenDrive,年内将量产上车
卓驭AI发布GenDrive:个性化生成式智驾,今年量产上市
卓驭AI发布GenDrive:个性化生成式智驾,今年量产上市

本文链接:http://www.28at.com/showinfo-45-11608-0.html英伟达Blackwell DGX系统刷新DeepSeek推理性能世界纪录

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:百川智能现金流强劲,茹立云:公司资金储备超48个月无忧!

下一篇:AMD潘晓明:携手伙伴加速中国AI PC生态,ISV合作伙伴将增至170家

最新热点