清华团队开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番
2025-03-18 11:19:39 AI 48观看
摘要 3 月 14 日消息,清华大学高性能计算研究所翟季冬教授团队、清华系科创企业清程极智今日联合宣布,大模型推理引擎“赤兔 Chitu”现已开源。据介绍,该引擎首次实现在非英伟达 Hopper 架构 GPU 及各类国产芯片上原

3 月 14 日消息,清华大学高性能计算研究所翟季冬教授团队、清华系科创企业清程极智今日联合宣布,大模型推理引擎“赤兔 Chitu”现已开源。4LB28资讯网——每日最新资讯28at.com

据介绍,该引擎首次实现在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行 FP8 精度模型,实现 DeepSeek 推理成本降低一半、性能翻番。其定位为“生产级大模型推理引擎”,提供如下特性:4LB28资讯网——每日最新资讯28at.com

多元算力适配:不仅支持 NVIDIA 最新旗舰到旧款的多系列产品,也为国产芯片提供优化支持。4LB28资讯网——每日最新资讯28at.com

全场景可伸缩:从纯 CPU 部署、单 GPU 部署到大规模集群部署,赤兔引擎提供可扩展的解决方案。4LB28资讯网——每日最新资讯28at.com

长期稳定运行:可应用于实际生产环境,稳定性足以承载并发业务流量。4LB28资讯网——每日最新资讯28at.com

官方表示,当前开源的赤兔引擎在部署 DeepSeek-R1-671B 满血版时,在 A800 集群的测试中,相比部分国外开源框架,实现了 GPU 使用量减少 50% 的同时,推理速度提升 3.15 倍。4LB28资讯网——每日最新资讯28at.com

附开源地址:https://github.com/thu-pacman/chitu4LB28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11560-0.html清华团队开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:【IT之家评测室】讯飞晓医体验评测:星火医疗大模型 X1 加持,更懂你的 AI 健康助手

下一篇:网信办等四部门印发《人工智能生成合成内容标识办法》,9 月起施行

最新热点