兴中资讯

要闻

13家媒体怒告OpenAl等AI巨头背后:“合理使用”or“偷窃”?内容

时间:2024-07-26 20:55

  间的“实质性相似”。

  这类具有较高公共利益的文本内容,如何平衡。该报举例称,2019年,发表了一篇荣获普利策奖的关于纽约市出租车行业掠夺性贷款的系列。该报称,只要稍加提示,ChatGPT就会一字不差地背诵其中的大部分内容。

  在ChatGPT响应中的呈现方式。

  正如新闻集团首席执行官Robert Thomson所称,“认可了顶级新闻应有顶级价格。数字化时代的一大特征是分销者占据主导地位,而内容创有外媒评论称,起诉或许也是谈判的手段之一。实际上,在起诉之前,与OpenAI一直在商谈授权合作协议,但在OpenAI加入了新的免责条款后,谈判破裂。

  对科技公司来说,支付授权费用一方面可以有效化解法律风险,另一方面可以获得更多优质训练数据,优质数据才是成为决定未来AI大模型的关键因素。毕竟,当前各大科技公司都正面临数据枯竭的现状。

  在6月更新的一项研究成果中,人工智能研究机构Epoch AI称,据他们估测,目前人类生成的公开文本总量约为300万亿个Token,但使用数据的速度远远超过了生成数据的速度,这意味着大模型将在2026年至2032年之间消耗完所有可用数据。

  那与AI公司合作到底能给媒体机构带来多大的收益?

  以新闻集团举例,而援引知情人士称,新闻集团与OpenAI的协议价值在五年内可能超过2.5亿美元,包括现金和使用OpenAI技术的积分形式的补偿。如此算来,相当于OpenAI每年将向新闻集团支付高达5000万美元的内容授权费用,这相当于新闻集团将近一个财季的净收入。

  从近期科技公司与媒体达成的合作金额来说,这一交易可以算是AI行业发展的里程碑事件。而且,新闻集团与OpenAI的协议并非是一份独家授权协议,意味着新闻集团还可以从谷歌等其他AI公司继续获得授权收入。

  汤森路透的财报也证实了合作带来的收益。一季度财报显示,路透社新闻业务的收入为2.1亿美元,同比增长3%。这一增长主要是由于汤森路透与伦敦证券交易所集团数据分析部门签订的新闻协议,根据该协议,路透社新闻将向LSEG授权提供新闻内容,后者用于生成AI相关内容。2024年第一季度,仅该协议为路透社新闻业务带来的收入就高达9600万美元。

  未经许可禁止、、及镜像等使用