Meta 承认使用盗版书籍来训练 AI,并拒绝赔偿作家
2024-01-18 09:36:52 AI 312观看
摘要 1 月 14 日消息,大型语言模型(LLM)技术近年来取得了巨大进步,但其背后却隐藏着版权纠纷的阴云。科技巨头们利用海量文本数据训练 LLM,其中难免会涉及到受版权保护的作品,招致作者和媒体组织的强烈抗议。图源 Pexels

1 月 14 日消息,大型语言模型(LLM)技术近年来取得了巨大进步,但其背后却隐藏着版权纠纷的阴云。科技巨头们利用海量文本数据训练 LLM,其中难免会涉及到受版权保护的作品,招致作者和媒体组织的强烈抗议。teO28资讯网——每日最新资讯28at.com

teO28资讯网——每日最新资讯28at.com

图源 Pexels

近日,Meta(前身为 Facebook)就因使用包含大量盗版书籍的“Books3”数据集训练其 LLAM 1 和 LLAM 2 模型而面临包括喜剧演员 Sarah Silverman 和作家 Richard Kadrey 在内的一众作者的集体诉讼。Meta 虽承认使用了 Books3 数据集,却拒绝向作者支付适当的补偿。teO28资讯网——每日最新资讯28at.com

Books3 是一个包含 19.5 万本图书、总容量近 37GB 的文本数据集,由 AI 研究者 Shawn Presser 于 2020 年创建,旨在为改进机器学习算法提供更好的数据源。Meta 也将其用于训练自己的 LLAM 模型,然而 Books3 中包含大量从盗版网站 Bibliotik 爬取的受版权保护作品,使得 Meta 的行为面临法律风险。teO28资讯网——每日最新资讯28at.com

注意到,Meta 的做法并非特例。此前,《纽约时报》也因 OpenAI 和微软使用其文章训练聊天机器人 ChatGPT 而对其提起诉讼。OpenAI 则辩称,不使用受版权保护的材料来训练 AI 模型“几乎不可能”,并要求法院驳回相关诉讼。Meta 同样否认故意侵犯版权,声称其使用 Books3 数据集属于合理使用范畴,无需获得许可、署名或支付补偿。teO28资讯网——每日最新资讯28at.com

此外,Meta 还在对诉讼作为集体诉讼的合法性提出异议,拒绝向提起诉讼的作家或其他参与 Books3 争议的人士提供任何形式的经济“补偿”。teO28资讯网——每日最新资讯28at.com

值得注意的是,Books3 数据集中的部分内容来自盗版网站 Bibliotik,该数据集在 2023 年被丹麦反盗版组织 Rights Alliance 要求下架,目前面临数字存档禁令。teO28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-3235-0.htmlMeta 承认使用盗版书籍来训练 AI,并拒绝赔偿作家

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:OpenAI 悄然更新使用政策,删除“明确禁止将技术用于军事、战争”措辞

下一篇:可协助 AI 语言模型改善自我纠错能力,谷歌推出 BIG-Bench Mistake 数据集

最新热点