要闻
Meta被曝下载数十TB盗版电子书用于AI训练
时间:2025-02-11 10:25
据报道,Meta因未经授权下载大量盗版电子书用于训练其AI模型而被一名图书作者起诉。最新泄露的邮件显示,Meta承认下载了一个有争议的大型数据集LibGen,其中包含数千万本盗版书籍。
根据法庭文件,Meta通过名为“安娜的档案”(Annas Archive)的渠道下载了至少81.7TB的数据,其中包括来自知名盗版网站Z-Library和LibGen的至少35.7TB的内容。此外,Meta还被指此前从LibGen下载了额外的80.6TB数据。作者指出,Meta的这一行为构成了非法的电子书库种子下载,且这一数字可能只是其盗版行为的冰山一角。
作者估计,这些盗版电子书库可能仅占Meta盗版版权作品总量的0.008%,这表明Meta的盗版规模可能远超目前所揭露的。邮件还显示,Meta公司员工也意识到其行为的法律风险。2023年4月,Meta的研究工程师尼古拉·巴什利科夫在邮件中表示:“用公司的笔记本电脑下BT感觉不妥。”到2023年9月,巴什科夫加大了抗议力度,并咨询了法律团队,他指出,使用Torrents意味着对文件进行“播种”,即对外共享内容,这在法律上是不允许的。
尽管如此,Meta仍决定继续,并试图通过将数据集下载到非Meta服务器来避免被追溯的风险。这一行为引发了法律专家和版权持有者的强烈谴责,认为Meta在追求AI技术进步的过程中,忽视了版权保护的重要性。
Meta的这一行为不仅可能面临巨额赔偿,还可能对其声誉造成严重影响。随着AI技术的快速发展,数据的合法获取和使用将成为行业面临的重要挑战之一。
- 上一篇:冬游黄河 遇见黄蓝交汇
- 下一篇:“赛博春节”未来科技疯狂吸睛