在第四届828 B2B企业节盛大开幕之际,华为云宣布了一项重大进展:其Tokens服务已成功整合至CloudMatrix384超节点系统。通过引入创新的xDeepServe架构,该系统在单芯片上实现了前所未有的性能突破,达到2400TPS的交易处理速度及50ms的超低时延,远超当前行业标准。4k228资讯网——每日最新资讯28at.com
面对中国AI算力需求的爆炸式增长,华为云凭借其独特的“综合优势”,正系统性地构建强大的计算能力。数据显示,从2024年初至今年6月底,中国日均Token消耗量从1000亿激增至30万亿,这一300多倍的增长不仅彰显了AI应用的迅速扩张,也对算力基础设施提出了更高要求。4k228资讯网——每日最新资讯28at.com
今年3月,华为云推出了基于MaaS(模型即服务)的Tokens服务,该服务不仅提供了多种计费模式,还根据应用场景和性能需求,推出了在线版、进线版、离线版及尊享版等多种服务方案。这一创新举措为大模型和智能体等AI工具提供了更加灵活、经济高效的算力支持。4k228资讯网——每日最新资讯28at.com
此次,Tokens服务的全面接入CloudMatrix384超节点,标志着华为云在算力领域迈出了关键一步。借助384超节点的原生xDeepServe框架,系统吞吐量从年初的1920TPS跃升至2400TPS,同时保持了50ms的低时延。这一成就得益于从硬件到软件、从算子到存储、从推理框架到超节点的全方位技术创新。4k228资讯网——每日最新资讯28at.com
CloudMatrix384超节点通过革新计算架构,打破了性能瓶颈,为澎湃算力奠定了坚实基础。而CANN(昇腾计算架构)硬件使能技术,通过优化算子和通信策略,确保了云端算力的高效调度与组合。EMS弹性内存存储技术打破了AI内存墙,实现了“以存强算”,充分释放了芯片潜能。xDeepServe分布式推理框架则通过Transformerless架构,将大模型拆解为可独立扩展的微模块,实现了超高效算力。4k228资讯网——每日最新资讯28at.com
xDeepServe的极致分离架构,如同将大模型拆解为“积木”,分派至不同NPU同步处理,再通过高性能通信库XCCL和自研推理引擎FlowServe重新组合,构建了一条超高速的Tokens处理流水线。这一创新不仅提升了单卡吞吐量至2400tokens/s,还为AI推理的线性扩展提供了可能。4k228资讯网——每日最新资讯28at.com
作为硬件加速的中间层,CANN包含了算子库和高性能通信库XCCL等组件,共同支撑了AI模型的高效运行。XCCL专为超节点上的大语言模型(LLM)服务设计,充分利用了CloudMatrix384的UB互联架构潜力,为Transformerless架构的全面分离提供了坚实的硬件基础。4k228资讯网——每日最新资讯28at.com
FlowServe引擎则采用了“去中心化”设计,将CloudMatrix384切割为完全自治的DP小组,每个小组具备完整的处理能力,确保了即便在千卡并发的情况下也能保持流畅运行。4k228资讯网——每日最新资讯28at.com
在模型支持方面,华为云MaaS服务已涵盖了DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型,以及versatile、Dify等主流Agent平台。通过大量的模型优化和技术积累,华为云实现了“源于开源,高于开源”的目标,使得大模型在昇腾云上能够更快、更好地运行。4k228资讯网——每日最新资讯28at.com
以文生图大模型为例,华为云通过量化技术和算子融合,在轻微牺牲画质的前提下,实现了两倍于业界主流平台的出图速度,并支持最大2K×2K尺寸。在文生视频大模型方面,通过量化和通算并行等技术,大幅降低了延迟和显存占用,实现了3.5倍的性能提升。4k228资讯网——每日最新资讯28at.com
在应用层面,华为云已与超过100家合作伙伴携手,深入行业场景,共同开发了丰富的Agent应用。这些应用涵盖了调研分析、内容创作、智慧办公、智能运维等多个领域,有效解决了产业难题,加速了企业的AI创新进程。4k228资讯网——每日最新资讯28at.com
例如,基于MaaS平台推出的今日人才数智员工解决方案,集成了先进的NLP、机器学习和深度学习技术,实现了智能交互和任务处理,显著提升了服务效率与客户满意度。而北京方寸无忧科技开发的无忧智慧公文解决方案,则通过智能化手段提升了公文处理效率,推动了政企办公的智能化转型。4k228资讯网——每日最新资讯28at.com
举报 0收藏 0打赏 0分享 0 更多>同类资讯马蜂窝陈罡:AI成旅游业变革核心,推动服务向全程智能化跃迁08-27

荣耀端侧AI语音技术突破,入选国际顶会,引领智能翻译新时代荣耀MagicOS副总裁孙建发表示,此次研究成果入选 INTERSPEECH,是对荣耀技术创新的鼓励,同样印证了“从用户需求出发”的研发理念,让每位用户在无网络环境下也能享受精准、实时的多语种翻译,这才是端侧…08-27

苹果AI布局加速,或将斥巨资收购欧洲两大AI初创企业IT之家 8 月 26 日消息,The Information 今晚报道称,苹果高管已就收购欧洲最大 AI 初创公司 Mistral 或Perplexity AI 相关事宜展开讨论,其中 Eddy Cue …08-27人工智能板块火热,AIETF(515070)近一年涨幅超110%,持仓股表现亮眼昨日高层印发“人工智能+”行动意见引爆科技赛道,人工智能AIETF(515070)持仓股中乐鑫科技20CM涨停、中科创达、瑞芯微、科大讯飞。 消息方面,摩根大通认为,鉴于杠杆率和估值仍处于适度水平,料中国股…08-27AI初创Anthropic与作家达成和解,版权争议风波暂告一段落08-27抖音副总裁李亮驳斥“人均7月离职”传闻:指其内容多为AI不实创作08-27谷歌AI模型精准预测大西洋飓风艾琳,展现气象预报新潜力08-27苹果加速AI布局,或收购两家法国AI初创企业08-27AI聊天机器人涉16岁少年自杀案,OpenAI面临首例非正常死亡诉讼08-27宾州州立大学首推人工智能工程学士,打造未来科技人才摇篮08-27AI医疗助手成投资新宠,Assort Health估值4月飙升3倍08-27Meta超级智能实验室人才流失,AI领域追赶之路遇阻08-27GPT-5宝可梦对战大获全胜,9517步新纪录彰显AI高效实力08-27AIETF富国(589380)收盘下跌3.20%,重仓股曝光,最新规模达2.01亿元AIETF富国(589380)成立于2025年6月20日,基金全称为富国上证科创板人工智能交易型开放式指数证券投资基金,基金简称为富国上证科创板人工智能ETF。殷钦怡自2025年6月20日管理(或拟管理)该…08-27寒武纪上半年业绩飙升43倍,股价创新高突破1400元大关寒武纪科技发布2025上半年财报,业绩实现惊人飞跃,营收激增43倍,净利润突破十亿大关。这家专注于人工智能芯片研发的企业,以其卓越的产品线和市场表现,再度吸引了业界的广泛关注。财报数据显示,寒武纪在2025年上半年实现了28.81亿元的营业收入,与去年同期相比,这08-27点击查看更多 +
全站最新
企业局域网监控全攻略:精选软件助您高效管理员工电脑行为

逆市飞扬!仅两家航司A380航班量超越疫情前水平

智慧火电“透视眼”,实时监控与预测维护引领行业新变革

物联网连接新选择:NB-IoT、Cat.1、eSIM各领风骚

Switch连接错误怎么办?实用方法助你快速恢复游戏体验

智汇云舟视频孪生:重塑数字世界,赋能行业智慧转型实践
热门内容- 雷军抖音账号变动引热议:武汉大学标签悄然消失?
- 云计算新纪元:云智融合引领未来趋势,安全与技术创新并行
- AI企业市场新格局:Anthropic超越OpenAI成首选
- 2025年人工智能发展蓝图:趋势、格局与行业应用深度剖析
- 阿里巴巴1688升级AI服务:新品App与查询工具上线,赋能中小企业高效采购
- 华为Mate 80系列爆料:全新麒麟9030,eSIM与低轨卫星通讯技术加持
- 浙大发布“悟空”类脑计算机:神经元规模超20亿,模拟猕猴大脑
- 红米Note15系列前瞻:7s芯片、7000mAh大电池,防水新标杆即将登场
- 字节跳动AI底层架构领跑2025:技术、组织与财务全面赋能AI时代
- 光伏电站智能化管理:提升效率,降低成本,助力“双碳”目标实现
- 雷军抖音账号母校标签“武汉大学”消失,或涉平台隐私调整
- 国家网信办约谈英伟达:要求阐释H20算力芯片安全隐患及后门风险
- AI浪潮下,微软研究预警:40种职业或面临变革挑战
- 马斯克将为Grok Heavy用户带来AI视频生成器及虚拟男友“Valentine”测试版
- 英伟达H20芯片安全风险引关注,网信办约谈要求说明“追踪定位”等技术详情
本栏最新
荣耀端侧AI语音技术突破,入选国际顶会,引领智能翻译新时代

苹果AI布局加速,或将斥巨资收购欧洲两大AI初创企业

算力产业迈向高质量,布局政策体系持续完善促发展

85后科学家企业家陈天石:寒武纪股价飙升,身价突破1500亿

国联股份等巨头广州联手,跨境智运新公司成立,注册资本达千万

IOTE深圳物联网展明日启幕,AI+IoT全产业链年度盛会邀您共襄盛举