苹果被诉涉嫌使用盗版书籍训练AI模型但公司称相关数据集未用于Apple Intelligence

2026-03-19 04:02

美国出版商Chicken Soup for the Soul于2026年3月18日向加州联邦法院提起诉讼，指控苹果、谷歌、Meta、Nvidia、OpenAI、Anthropic、Perplexity AI及xAI等科技公司未经授权使用其图书内容训练人工智能系统。诉讼指出，被告从The Pile、LibGen等盗版网站下载大量受版权保护的书籍，并用于训练大型语言模型。苹果被指使用了The Pile和Books 3数据集训练其基础模型，但公司此前已声明该数据集仅用于研究，未用于Apple Intelligence或任何产品功能。此案引发对AI训练数据来源合法性的广泛关注，可能影响AI行业合...

苹果被诉涉嫌使用盗版书籍训练AI模型但公司称相关数据集未用于Apple Intelligence

美国出版商Chicken Soup for the Soul于2026年3月18日向加州联邦法院提起集体诉讼，指控苹果（AAPL.O）、谷歌（GOOGL.O）、Meta Platforms（META.O）、Nvidia（NVDA.O）、OpenAI、Anthropic、Perplexity AI及Elon Musk旗下xAI等科技公司，未经授权使用其出版的图书内容训练人工智能系统。

诉讼文件指出，被告通过下载The Pile、LibGen、Z-Library及Anna’s Archive等盗版网站上的书籍，非法复制、解析并嵌入其大型语言模型（LLMs）中，以加速生成式AI技术开发。原告称，这些行为构成对数千名作者版权的严重侵犯，包括畅销书作家、普利策奖得主及非虚构类作品创作者。

诉讼特别提及苹果“Apple Foundation Models”依赖于The Pile和Books 3数据集进行训练。然而，苹果此前曾公开表示，The Pile数据集仅用于研究目的，并未用于任何实际产品或Apple Intelligence功能。该公司强调，其AI产品所采用的模型训练数据来源符合法律与伦理要求。

此案引发业界对AI训练数据合法性及版权边界的新一轮讨论。尽管苹果已澄清相关数据集未用于商业产品，但法院将如何认定“研究用途”与“实际应用”的界限，仍需等待司法审理结果。

编辑点评

编

编辑点评

2026-03-19 04:02

此案凸显AI技术发展与知识产权保护之间的深层矛盾。随着大模型训练数据规模的扩张，企业从公共或盗版资源获取内容已成为行业隐忧，而法律监管长期滞后。美国出版商的集体诉讼不仅是对苹果、谷歌等巨头的直接挑战，更可能推动全球AI行业建立更严格的合规框架。若法院裁定使用盗版内容构成侵权，将迫使科技公司重新评估数据获取策略，或推动建立授权数据市场。从长远看，此案或成为AI治理的标志性事件，影响全球AI研发的法律边界与商业模式。苹果虽称相关数据未用于Apple Intelligence，但其被卷入诉讼本身已构成品牌风险，未来需在技术创新与合规之间寻求更平衡的路径。

苹果被诉涉嫌使用盗版书籍训练AI模型 但公司称相关数据集未用于Apple Intelligence

编辑点评

相关阅读

苹果欲推动应用集成Siri功能，开发者担忧未来抽成

苹果正研发AI智能体接入App Store系统 有望在WWDC发布

富士康遭网络攻击事件：黑客声称窃取超1100万文件，涉及苹果、谷歌、英伟达等客户

苹果在巴西因涉嫌虚假宣传AI功能广告被调查

微软等科技巨头五月补丁日修复大量安全漏洞 人工智能助力漏洞检测

苹果被诉涉嫌使用盗版书籍训练AI模型但公司称相关数据集未用于Apple Intelligence

苹果正研发AI智能体接入App Store系统有望在WWDC发布

微软等科技巨头五月补丁日修复大量安全漏洞人工智能助力漏洞检测