← 返回

微软删除鼓励使用盗版哈利波特书籍训练AI的博客

微软本周删除一篇2024年11月发布的博客,该文被指引导开发者从Kaggle平台获取七本哈利波特小说训练Azure AI模型。数据集上传者承认公共领域标签错误并删除内容。

微软删除涉及哈利波特版权争议的AI训练指南

微软公司于2026年2月19日删除其技术博客平台上的相关内容,该博客发布于2024年11月。文章作者为微软高级产品经理普佳·卡马特,文中详细演示了如何通过下载《哈利波特》系列七本书籍的Kaggle数据集构建问答系统和生成同人小说。

经调查发现,Kaggle平台上传的《哈利波特》数据集被错误标注为公共领域内容。数据集上传者数据科学家舒布罕·梅恩多拉向《麻省理工科技评论》承认这是「一个失误」,在媒体询问后已删除该数据集。微软官方表示,已全面审查相关AI训练指南并立即下架违规内容。

事件源于Hacker News用户对该博客的讨论,指出其涉嫌鼓励使用受版权保护内容进行AI模型训练。微软Azure平台曾附带生成哈利波特风格AI图像的代码示例,引发法律界对AI数据合规性的广泛争议。

编辑点评

此次事件凸显全球科技企业在AI伦理与知识产权保护间的博弈。微软作为AI研发领军者,其公开文档的合规性直接影响行业标准。J.K.罗琳的《哈利波特》系列在全球拥有超过5亿册销量,版权问题涉及跨国法律适用。此次数据集标注失误可能引发连锁反应:一方面,AI训练数据来源合法性成为技术巨头新风险点;另一方面,英国作为原作品版权方核心利益相关方,或推动国际版权规则重构。值得关注后续是否会形成跨国诉讼,以及科技企业如何平衡创新需求与版权责任。若类似事件频发,可能促使欧美国家加速制定AI训练数据合规框架,影响全球AI发展路径。

相关消息:https://it.slashdot.org/story/26/02/20/1918241/microsoft-deletes-blog-telling-users-to-train-ai-on-pirated-harry-potter-books?utm_source=rss1.0mainlinkanon&utm_medium=feed