苹果被诉涉嫌使用盗版书籍训练AI模型 但公司称相关数据集未用于Apple Intelligence
美国出版商Chicken Soup for the Soul于2026年3月18日向加州联邦法院提起集体诉讼,指控苹果(AAPL.O)、谷歌(GOOGL.O)、Meta Platforms(META.O)、Nvidia(NVDA.O)、OpenAI、Anthropic、Perplexity AI及Elon Musk旗下xAI等科技公司,未经授权使用其出版的图书内容训练人工智能系统。
诉讼文件指出,被告通过下载The Pile、LibGen、Z-Library及Anna’s Archive等盗版网站上的书籍,非法复制、解析并嵌入其大型语言模型(LLMs)中,以加速生成式AI技术开发。原告称,这些行为构成对数千名作者版权的严重侵犯,包括畅销书作家、普利策奖得主及非虚构类作品创作者。
诉讼特别提及苹果“Apple Foundation Models”依赖于The Pile和Books 3数据集进行训练。然而,苹果此前曾公开表示,The Pile数据集仅用于研究目的,并未用于任何实际产品或Apple Intelligence功能。该公司强调,其AI产品所采用的模型训练数据来源符合法律与伦理要求。
此案引发业界对AI训练数据合法性及版权边界的新一轮讨论。尽管苹果已澄清相关数据集未用于商业产品,但法院将如何认定“研究用途”与“实际应用”的界限,仍需等待司法审理结果。
编辑点评
此案凸显AI技术发展与知识产权保护之间的深层矛盾。随着大模型训练数据规模的扩张,企业从公共或盗版资源获取内容已成为行业隐忧,而法律监管长期滞后。美国出版商的集体诉讼不仅是对苹果、谷歌等巨头的直接挑战,更可能推动全球AI行业建立更严格的合规框架。若法院裁定使用盗版内容构成侵权,将迫使科技公司重新评估数据获取策略,或推动建立授权数据市场。从长远看,此案或成为AI治理的标志性事件,影响全球AI研发的法律边界与商业模式。苹果虽称相关数据未用于Apple Intelligence,但其被卷入诉讼本身已构成品牌风险,未来需在技术创新与合规之间寻求更平衡的路径。