目 录CONTENT

文章目录

Adobe因涉嫌滥用作者作品训练AI而面临集体诉讼

Administrator
2025-12-18 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://techcrunch.com/2025/12/17/adobe-hit-with-proposed-class-action-accused-of-misusing-authors-work-in-ai-training/

原文作者:Lucas Ropek


和几乎所有现存的科技公司一样,Adobe在过去几年中大力投入人工智能(AI)。这家软件公司自2023年以来推出了许多不同的AI服务,包括其AI驱动的媒体生成套件Firefly。然而,如今该公司对技术的全力拥抱可能引发了麻烦,因为一项新诉讼声称它使用盗版书籍来训练其一个AI模型。

这项由俄勒冈州作家伊丽莎白·里昂(Elizabeth Lyon)代表提出的拟议集体诉讼声称,Adobe使用包括她自己作品在内的众多书籍的盗版版本来训练该公司的SlimLM程序。

Adobe将SlimLM描述为一系列小型语言模型,可以被“优化用于移动设备上的文档辅助任务”。它声称SlimLM是在SlimPajama-627B上预训练的,SlimPajama-627B是Cerebras于2023年6月发布的“去重、多语料、开源数据集”。里昂(她撰写了多本非虚构写作指南)表示,她的部分作品被包含在Adobe使用的预训练数据集中。

据路透社最初报道的里昂的诉讼指出,她的写作被包含在作为Adobe程序基础的一个经过处理的、被篡改的数据集子集中:“SlimPajama数据集是通过复制和修改RedPajama数据集(包括复制Books3)而创建的,”诉讼中写道。“因此,由于它是RedPajama数据集的衍生副本,SlimPajama包含了Books3数据集,其中就包括原告和集体成员的受版权保护的作品。”

Books3”——一个包含191,000本曾被用于训练生成式AI系统的书籍的庞大集合——一直是科技界法律纠纷的持续来源。RedPajama也已在许多诉讼案件中被提及。九月份,一项针对苹果的诉讼声称该公司使用受版权保护的材料来训练其Apple Intelligence模型。诉讼中提到了该数据集,并指控这家科技公司“未经许可、未经署名或补偿”复制受保护的作品。十月份,一项针对Salesforce的类似诉讼声称该公司为训练目的使用了RedPajama。

对科技行业来说不幸的是,此类诉讼至今已变得司空见惯。AI算法是在海量数据集上训练的,在某些情况下,这些数据集被指控包含了盗版材料。九月份,Anthropic同意向起诉它的众多作家支付15亿美元,这些作家指控Anthropic使用其作品的盗版版本来训练其Claude聊天机器人。此案被视为正在进行的大量关于AI训练数据中受版权保护材料的法律战中的一个潜在转折点。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区