在第四届828 B2B企业节盛大开幕的当天下午,华为云传来了一则令人瞩目的消息:其Tokens服务已成功全面融入CloudMatrix384超节点,这一融合标志着华为云在AI算力领域的又一次重大突破。v9z28资讯网——每日最新资讯28at.com
得益于xDeepServe架构的创新应用,华为云Tokens服务的性能得到了显著提升。具体而言,该服务在单芯片上实现了2400TPS的吞吐量,同时保持了50ms的TPOT(Token处理时延),这一成绩无疑为AI算力的应用树立了新的标杆。v9z28资讯网——每日最新资讯28at.com
近年来,中国AI算力需求呈现出爆炸式增长。数据显示,从2024年初至2025年6月底,中国的日均Token消耗量从1000亿激增到30万亿,短短一年半时间内增长了300多倍。这一趋势对算力基础设施提出了前所未有的挑战。为了满足这一需求,华为云在2025年3月推出了基于MaaS(模型即服务)的Tokens服务,提供了多种规格以满足不同应用场景的需求。v9z28资讯网——每日最新资讯28at.com
v9z28资讯网——每日最新资讯28at.com
此次Tokens服务与CloudMatrix384超节点的结合,更是将这一服务的性能推向了新的高度。依托超节点的xDeepServe框架,Tokens服务的吞吐量从年初的1920TPS跃升至2400TPS。这一提升的背后,是华为云对于大算力构建全栈创新的深刻理解,包括硬件、软件、算子、存储、推理框架及超节点等各个环节的协同优化。v9z28资讯网——每日最新资讯28at.com
xDeepServe架构作为CloudMatrix384超节点的原生服务,其创新之处在于采用了Transformerless极致分离架构。这一架构将MoE大模型拆解为Attention、FFN、Expert三个可独立伸缩的微模块,并通过微秒级XCCL通信库与FlowServe自研推理引擎进行高效整合。经过这样的优化,单卡的吞吐量从非超节点的600tokens/s大幅提升至2400tokens/s。v9z28资讯网——每日最新资讯28at.com
v9z28资讯网——每日最新资讯28at.com
华为云还透露了xDeepServe架构的未来发展计划。目前,该架构已经实现了MA分离,未来还将进一步将Attention、MoE、Decode改造为数据流,并扩展至多台超节点,以实现推理吞吐的线性提升。v9z28资讯网——每日最新资讯28at.com
在应用层面,华为云Tokens服务已经支持了包括DeepSeek、Kimi、Qwen等在内的主流大模型,以及versatile、Dify等主流Agent平台。同时,华为云还与超过100家合作伙伴携手,在多个领域开发AI Agent,如调研分析、内容创作、智慧办公、智能运维等。这些应用不仅提升了服务效率与客户满意度,还推动了政企办公的智能化转型。v9z28资讯网——每日最新资讯28at.com
例如,基于MaaS平台的今日人才数智员工解决方案,通过集成自然语言处理、机器学习等技术,为企业提供了智能化的人才管理服务。而北京方寸无忧科技开发的无忧智慧公文解决方案,则利用AI技术实现了公文的自动化处理,大大提高了办公效率。v9z28资讯网——每日最新资讯28at.com
举报 0收藏 0打赏 0分享 0 更多>同类资讯
Karpathy力赞!AGI基础设施新突破,开源环境中心引领AI未来除此之外,EnvironmentsHub关心的重点是,让人人都能用上这套基础设施,使研究人员和初创公司都能为自己的任务训练模型、集成工具、运行强化微调,以及优化Agent支撑框架。 通过降低这一门槛,En…08-29微软首发自研AI模型:MAI-Voice-1实现秒速音频生成,探索Copilot新功能08-292025年全球智能手机出货量预计增1%,IDC:苹果与新技术成增长引擎08-29慧与HPE升级Mist平台:AI智能体引领网络运维自主化新篇章08-29奇点灵智获数千万融资,升级儿童AI教育平台,智能英语机器人引领启蒙新潮流08-29

“斫轮·九章”亮相:轨道交通车辆健康管理迎来智能化新篇章08-29英伟达依赖症?两大客户撑起近四成营收引关注08-29

百度智能云全新升级,推出“AI吴彦祖”数字员工及一见工序合规分析面对AI云基础设施的投入,从成本中心转化为新型利润中心的行业新趋势,今年云智大会上,百度智能云全新升级了百舸AI计算平台5.0和千帆企业级AI开发平台4.0,让企业能够以更低成本、更高效率部署和开发AI产…08-29

百度智能云全面升级,2025云智大会发布“AI 吴彦祖”数字员工百度集团执行副总裁、百度智能云事业群总裁沈抖在会上提出核心论断:“智能经济时代,需要以‘智能优先’为核心的 AI云作为新基础设施”,并宣布百度智能云完成全方位升级 —— 推出百舸 AI 计算平台 5.0、千…08-29

科创AIETF午间收涨2.20%,半日成交额破11亿,重仓股表现各异来源:新浪基金∞工作室 8月28日,截止午间收盘,科创AIETF(588790)涨2.20%,报0.837元,成交额11.48亿元。科创AIETF(588790)重仓股方面,寒武纪截止午盘涨7.13%,澜起科…08-29

科创人工智能ETF华宝开盘下滑,重仓股表现分化,寒武纪领涨来源:新浪基金∞工作室 8月28日,科创人工智能ETF华宝(589520)开盘跌1.79%,报1.208元。科创人工智能ETF华宝(589520)重仓股方面,寒武纪开盘涨3.49%,澜起科技涨0.74%,金山…08-29

铜仁数博会:11大应用场景璀璨亮相,展现数字经济新实力8月27日,2025中国国际大数据产业博览会专业展在贵阳国际会议展览中心盛大开展,铜仁市“场景大数据 数字经济铜仁实践”馆同步开馆迎宾,以11个极具特色的应用场景吸引众多目光,展示铜仁在数字领域的卓越实践成果…08-29

王国栋院士:人工智能引领钢铁行业转型升级,迈向绿色未来中国工程院院士王国栋日前在“AI+钢铁”技术发布会期间接受人民网记者专访时表示,要利用钢铁行业丰富的大数据、专家的理论与经验,以及生成式人工智能(AIGC)技术,实施“数据密集、智能涌现、人机协同”的三元认知…08-29

中国电信2025数博会展示“优数精算”,四大展区共绘数智转型新蓝图8月28日,2025中国国际大数据产业博览会在贵州贵阳开幕,中国电信作为建设网络强国、科技强国、数字中国和维护网信安全的国家队和主力军,以“优数精算 星辰智惠”主题精彩亮相,全面展示云改数转智惠战略升级成效…08-29

AI重塑云计算版图,百度智能云领跑智能化转型新赛道经过反复实践,百度智能云得出的结论是,算力、模型、数据和工程能力,构成了AI云的四项核心要素。 以百度智能云为例,其通过百度百舸(AI基础设施)、千帆大模型平台(模型与应用开发),以及行业解决方案,为企业提…08-29点击查看更多 +
全站最新
2025成都车展亮点:荣威M7 DMH豪华轿车预售,续航超160km仅9.78万起

岚图港股上市:以科技为翼,产业金融双轮驱动新能源未来

智己LS6成都车展吸睛,超级增程技术引领,预售订单火爆突破4.8万

岚图知音上市:华为技术加持,20.29万起售,配置全面升级

奇瑞X3L预售开启,加长增程动力强劲,配置多样价格亲民引关注

岚图梦想家26款成都车展首发预售,东方美学与智能科技并存
热门内容- 雷军抖音账号变动引热议:武汉大学标签悄然消失?
- 云计算新纪元:云智融合引领未来趋势,安全与技术创新并行
- DeepSeek V3.1大模型升级,适配国产新芯片,性能显著提升
- AI企业市场新格局:Anthropic超越OpenAI成首选
- 浙大发布“悟空”类脑计算机:神经元规模超20亿,模拟猕猴大脑
- 红米Note15系列前瞻:7s芯片、7000mAh大电池,防水新标杆即将登场
- 光伏电站智能化管理:提升效率,降低成本,助力“双碳”目标实现
- 雷军抖音账号母校标签“武汉大学”消失,或涉平台隐私调整
- 国家网信办约谈英伟达:要求阐释H20算力芯片安全隐患及后门风险
- AI浪潮下,微软研究预警:40种职业或面临变革挑战
- 英伟达H20芯片安全风险引关注,网信办约谈要求说明“追踪定位”等技术详情
- 马斯克将为Grok Heavy用户带来AI视频生成器及虚拟男友“Valentine”测试版
- 科创板AI基金8月22日净值飙升7.79%,重仓股表现抢眼
- 马斯克新推:视频生成器Imagine与AI虚拟男友Valentine即将登陆Grok Heavy
- 可可西里迎来科技新成员:“机器藏羚羊”助力零干扰科研观测
本栏最新
“斫轮·九章”亮相:轨道交通车辆健康管理迎来智能化新篇章

百度智能云全新升级,推出“AI吴彦祖”数字员工及一见工序合规分析

百度智能云全面升级,2025云智大会发布“AI 吴彦祖”数字员工

科创AIETF午间收涨2.20%,半日成交额破11亿,重仓股表现各异

科创人工智能ETF华宝开盘下滑,重仓股表现分化,寒武纪领涨

铜仁数博会:11大应用场景璀璨亮相,展现数字经济新实力