Meta遭集体诉讼大量盗版书籍引发关注

一便士的月亮

原创

01-14

近年来，大型语言模型（LLM）技术取得了显著进展。然而，在背后隐藏着版权纠纷的阴影。科技巨头们利用海量文本数据来训练这些LLM模型，往往涉及受版权保护的作品，这引起了作者和媒体组织的强烈反对。

最近，Meta（原名Facebook）因在其“Books3”数据集训练其LLAM 1和LLAM 2模型中使用大量盗版书籍而面临包括喜剧演员Sarah Silverman和作家Richard Kadrey等一众作者的集体诉讼。尽管Meta承认使用了Books3数据集，但他们拒绝向作者支付适当的补偿金。

Books3是一个由AI研究者Shawn Presser于2020年创建的数据集，包含19.5万本图书、总容量近37GB，旨在为改进机器学习算法提供更好的数据源。Meta将其用于训练自己的LLAM模型，但在其中包含了大量从盗版网站Bibliotik抓取的受版权保护作品，从而使得Meta的行为陷入了法律困境。

值得注意的是，《纽约时报》也曾因为OpenAI和微软使用其文章训练聊天机器人ChatGPT而对其提起诉讼。OpenAI辩称，不使用受版权保护的材料来训练AI模型几乎是不可能的，并要求法院驳回相关诉讼。与之不同，Meta声称其使用Books3数据集属于合理使用范畴，无需获得许可、署名或支付补偿。

此外，Meta还对这些诉讼是否属于集体诉讼持有异议，并拒绝向那些起诉他们的人提供任何形式的经济“补偿”。需要指出的是，Books3数据集中部分内容来自丹麦反盗版组织Rights Alliance下架后面临的数字存档禁令。

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



vivo X100 Ultra(12GB/256GB)

vivo X100 Ultra(12GB/256GB)

3952人评分

80%好评

HUAWEI Mate 60（12GB/256GB）

HUAWEI Mate 60（12GB/256GB）

2189人评分

79%好评

Redmi K70至尊版(12GB/256GB)

Redmi K70至尊版(12GB/256GB)

265人评分

79%好评

荣耀X50（8GB/128GB）

荣耀X50（8GB/128GB）

8635人评分

79%好评

小米14(8GB/256GB)

小米14(8GB/256GB)

7618人评分

78%好评

评论

更多评论

读过此文的还读过

点击加载更多

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具