大英百科全书起诉OpenAI涉嫌盗用内容训练ChatGPT

2026-03-17 10:32

大英百科全书与韦氏词典出版社于2026年3月17日联合起诉OpenAI，指控其在训练AI模型（如GPT-4）过程中未经授权大量复制其受版权保护的内容，并生成与原始文本高度相似的回应。诉讼称，GPT-4已‘记忆’大量百科内容，可按需输出几乎逐字复制的段落，构成非法复制。此外，双方指控OpenAI通过AI生成内容直接替代其网站内容，削弱其流量。此案是近年来出版商对AI公司发起的一系列版权诉讼之一，此前《纽约时报》亦有类似指控，Anthropic亦曾因使用受版权保护书籍训练模型而支付15亿美元和解金。

大英百科全书起诉OpenAI涉嫌盗用内容训练ChatGPT

大英百科全书（Encyclopedia Britannica）与韦氏词典出版社（Merriam-Webster）于2026年3月17日联合向美国法院提起诉讼，指控人工智能公司OpenAI在训练其AI模型（包括GPT-4）过程中，未经授权大规模复制其受版权保护的内容，并生成与原始文本“高度相似”的回应。

诉讼文件指出，GPT-4模型已“记忆”大量大英百科全书的版权内容，能够按用户请求输出几乎逐字复制的段落。这些内容被视为未经授权的复制，被用于训练模型。诉讼还提供了OpenAI模型生成的文本与大英百科全书原文并列的实例，显示多个段落完全一致。

此外，两家出版商指控OpenAI通过AI生成内容“替代或直接竞争”其网站内容，而非像传统搜索引擎那样引导用户访问其官方网站，从而导致其网站流量被“蚕食”（cannibalizing）。

此案是近年来出版界针对AI公司发起的多起版权诉讼之一。此前，《纽约时报》曾指控OpenAI非法使用其大量版权内容训练模型。2023年9月，AI公司Anthropic因使用受版权保护的书籍训练模型，与作者达成和解，支付15亿美元赔偿金。

此诉讼可能进一步加剧全球对AI训练数据来源合法性的关注，并对AI模型开发的合规成本和内容授权机制产生深远影响。

编辑点评

编

编辑点评

2026-03-17 10:32

此次大英百科全书与韦氏词典对OpenAI的诉讼，标志着传统知识出版机构在AI时代对数据产权的集体反击。随着大模型训练依赖海量文本数据，版权边界正面临前所未有的挑战。此案不仅涉及法律层面的‘合理使用’界定，更触及AI行业可持续发展的核心——数据来源合法性。若法院裁定OpenAI存在侵权，可能迫使AI公司重构数据采集与训练流程，增加授权成本，甚至推动全球范围内建立AI训练数据的版权许可框架。同时，此案也可能激励更多内容创作者和出版机构效仿诉讼，形成对AI企业的系统性法律压力。从长远看，若AI公司持续依赖未授权内容训练模型，将动摇公众对AI生成内容可靠性和原创性的信任，进而影响其在教育、科研等领域的应用前景。

大英百科全书起诉OpenAI涉嫌盗用内容训练ChatGPT

编辑点评

相关阅读

软银愿景基金年度盈利460亿美元 主要受益于对OpenAI巨额投资

家庭起诉OpenAI：指控ChatGPT医疗建议致其子意外过量死亡

OpenAI首席执行官阿尔特曼作证称马斯克曾试图控制公司

奥特曼在马斯克诉OpenAI案庭审中作证，称马斯克曾威胁将公司传给子女

马斯克与奥尔特曼庭审交锋：奥尔特曼称马斯克曾提议将OpenAI传给其子女

软银愿景基金年度盈利460亿美元主要受益于对OpenAI巨额投资