← 返回

大英百科全书起诉OpenAI涉嫌盗用内容训练ChatGPT

大英百科全书与韦氏词典出版社于2026年3月17日联合起诉OpenAI,指控其在训练AI模型(如GPT-4)过程中未经授权大量复制其受版权保护的内容,并生成与原始文本高度相似的回应。诉讼称,GPT-4已‘记忆’大量百科内容,可按需输出几乎逐字复制的段落,构成非法复制。此外,双方指控OpenAI通过AI生成内容直接替代其网站内容,削弱其流量。此案是近年来出版商对AI公司发起的一系列版权诉讼之一,此前《纽约时报》亦有类似指控,Anthropic亦曾因使用受版权保护书籍训练模型而支付15亿美元和解金。

大英百科全书起诉OpenAI涉嫌盗用内容训练ChatGPT

大英百科全书(Encyclopedia Britannica)与韦氏词典出版社(Merriam-Webster)于2026年3月17日联合向美国法院提起诉讼,指控人工智能公司OpenAI在训练其AI模型(包括GPT-4)过程中,未经授权大规模复制其受版权保护的内容,并生成与原始文本“高度相似”的回应。

诉讼文件指出,GPT-4模型已“记忆”大量大英百科全书的版权内容,能够按用户请求输出几乎逐字复制的段落。这些内容被视为未经授权的复制,被用于训练模型。诉讼还提供了OpenAI模型生成的文本与大英百科全书原文并列的实例,显示多个段落完全一致。

此外,两家出版商指控OpenAI通过AI生成内容“替代或直接竞争”其网站内容,而非像传统搜索引擎那样引导用户访问其官方网站,从而导致其网站流量被“蚕食”(cannibalizing)。

此案是近年来出版界针对AI公司发起的多起版权诉讼之一。此前,《纽约时报》曾指控OpenAI非法使用其大量版权内容训练模型。2023年9月,AI公司Anthropic因使用受版权保护的书籍训练模型,与作者达成和解,支付15亿美元赔偿金。

此诉讼可能进一步加剧全球对AI训练数据来源合法性的关注,并对AI模型开发的合规成本和内容授权机制产生深远影响。

编辑点评

此次大英百科全书与韦氏词典对OpenAI的诉讼,标志着传统知识出版机构在AI时代对数据产权的集体反击。随着大模型训练依赖海量文本数据,版权边界正面临前所未有的挑战。此案不仅涉及法律层面的‘合理使用’界定,更触及AI行业可持续发展的核心——数据来源合法性。若法院裁定OpenAI存在侵权,可能迫使AI公司重构数据采集与训练流程,增加授权成本,甚至推动全球范围内建立AI训练数据的版权许可框架。同时,此案也可能激励更多内容创作者和出版机构效仿诉讼,形成对AI企业的系统性法律压力。从长远看,若AI公司持续依赖未授权内容训练模型,将动摇公众对AI生成内容可靠性和原创性的信任,进而影响其在教育、科研等领域的应用前景。

相关消息:https://www.theverge.com/ai-artificial-intelligence/895372/encyclopedia-britannica-openai-lawsuit
当日日报:查看 2026年03月17日 当日日报