Adobe因涉嫌滥用作者作品训练AI而面临集体诉讼-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://techcrunch.com/2025/12/17/adobe-hit-with-proposed-class-action-accused-of-misusing-authors-work-in-ai-training/

原文作者：Lucas Ropek

和几乎所有现存的科技公司一样，Adobe在过去几年中大力投入人工智能（AI）。这家软件公司自2023年以来推出了许多不同的AI服务，包括其AI驱动的媒体生成套件Firefly。然而，如今该公司对技术的全力拥抱可能引发了麻烦，因为一项新诉讼声称它使用盗版书籍来训练其一个AI模型。

这项由俄勒冈州作家伊丽莎白·里昂（Elizabeth Lyon）代表提出的拟议集体诉讼声称，Adobe使用包括她自己作品在内的众多书籍的盗版版本来训练该公司的SlimLM程序。

Adobe将SlimLM描述为一系列小型语言模型，可以被“优化用于移动设备上的文档辅助任务”。它声称SlimLM是在SlimPajama-627B上预训练的，SlimPajama-627B是Cerebras于2023年6月发布的“去重、多语料、开源数据集”。里昂（她撰写了多本非虚构写作指南）表示，她的部分作品被包含在Adobe使用的预训练数据集中。

据路透社最初报道的里昂的诉讼指出，她的写作被包含在作为Adobe程序基础的一个经过处理的、被篡改的数据集子集中：“SlimPajama数据集是通过复制和修改RedPajama数据集（包括复制Books3）而创建的，”诉讼中写道。“因此，由于它是RedPajama数据集的衍生副本，SlimPajama包含了Books3数据集，其中就包括原告和集体成员的受版权保护的作品。”

“Books3”——一个包含191,000本曾被用于训练生成式AI系统的书籍的庞大集合——一直是科技界法律纠纷的持续来源。RedPajama也已在许多诉讼案件中被提及。九月份，一项针对苹果的诉讼声称该公司使用受版权保护的材料来训练其Apple Intelligence模型。诉讼中提到了该数据集，并指控这家科技公司“未经许可、未经署名或补偿”复制受保护的作品。十月份，一项针对Salesforce的类似诉讼也声称该公司为训练目的使用了RedPajama。

对科技行业来说不幸的是，此类诉讼至今已变得司空见惯。AI算法是在海量数据集上训练的，在某些情况下，这些数据集被指控包含了盗版材料。九月份，Anthropic同意向起诉它的众多作家支付15亿美元，这些作家指控Anthropic使用其作品的盗版版本来训练其Claude聊天机器人。此案被视为正在进行的大量关于AI训练数据中受版权保护材料的法律战中的一个潜在转折点。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

Adobe因涉嫌滥用作者作品训练AI而面临集体诉讼

评论区