中文互联网基础语料 3.0 发布:数据量为 120GB,助力大模型训练与 AI 发展
2025-09-22 10:13:25 AI 17观看
摘要 9 月 18 日消息,今日上午,在昆明召开的 2025 年国家网络安全宣传周人工智能安全治理分论坛上,中文互联网基础语料 3.0 正式向社会发布。在中央网信办相关部门指导下,中国网络空间安全协会会同国家互联网应急中心

9 月 18 日消息,今日上午,在昆明召开的 2025 年国家网络安全宣传周人工智能安全治理分论坛上,中文互联网基础语料 3.0 正式向社会发布。OY928资讯网——每日最新资讯28at.com

OY928资讯网——每日最新资讯28at.com

在中央网信办相关部门指导下,中国网络空间安全协会会同国家互联网应急中心等单位,在前期发布中文互联网基础语料 1.0 和 2.0 的基础上,持续发挥企业、高校和科研单位协同优势,依托网安协会人工智能安全治理专委会建立的语料共建共享机制,汇聚一批新的高质量可信数据,经过信源筛选、内容过滤、数据去重等一系列严格细致的数据加工处理措施,形成并对社会发布中文互联网基础语料 3.0。本批语料扩大了优质中文网站信源范围,加强了违法不良信息过滤,数据量为 120GB,可为大模型训练和人工智能发展提供可信数据支持。用户登录中国网络空间安全协会网站(https://www.cybersac.cn/newhome),点击“中文互联网语料资源平台”链接,通过注册、认证等程序,即可下载相关语料。OY928资讯网——每日最新资讯28at.com

网安协会负责人表示,中文互联网基础语料 3.0 是各界协同共建高质量中文语料的又一重要成果,进一步丰富了高质量中文语料的供给。下一步,网安协会将会同国家互联网应急中心等单位,协同各行业领域,持续加强中文互联网基础语料建设,为人工智能技术创新和产业发展提供有力支撑和保障。OY928资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-27861-0.html中文互联网基础语料 3.0 发布:数据量为 120GB,助力大模型训练与 AI 发展

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:科技部:正在推动人形机器人在汽车制造、物流搬运、电力巡检等场景加速落地应用

下一篇:马斯克“巨硬计划”新动作曝光:从 0 建起算力集群,6 个月完成 OpenAI & 甲骨文 15 个月的工作

最新热点