电子前沿基金会警告:出版商阻断互联网档案馆将危及历史记录保存
电子前沿基金会(EFF)高级政策分析师乔·穆林(Joe Mullin)指出,近期包括《纽约时报》在内的多家新闻出版机构开始使用技术手段阻止互联网档案馆(Internet Archive)抓取其网站内容,此举相当于“禁止图书馆保存报纸副本”,可能危及数十年来积累的数字历史记录。
互联网档案馆自1990年代中期上线以来,一直是全球最大的数字图书馆,长期保存包括报纸在内的各类网络内容。但自去年末以来,《纽约时报》开始采用超出传统robots.txt规则的技术措施,限制档案馆的网络爬虫访问其网站。《卫报》等其他媒体似乎也正效仿这一做法。
出版商表示此举源于对人工智能公司大量抓取新闻内容用于训练模型的担忧,部分机构已对AI公司提起诉讼,要求明确此类行为是否构成版权侵权。EFF认为,AI训练在法律上可能属于合理使用范畴,但即便如此,封禁非营利性存档机构并非恰当应对方式。
EFF强调,互联网档案馆不从事商业AI开发,其核心使命是保存公共历史记录。若出版商因AI争议而切断档案馆的存取权限,实则可能“焚毁数十年的历史档案”。即使未来法院对AI训练作出限制,网络存档的法律基础已相当稳固,不应因商业纠纷牺牲公共利益。
EFF呼吁出版商重新评估其策略,避免因短期争议损害长期公共知识传承。
编辑点评
此事件凸显了数字时代信息保存与知识产权之间的深层矛盾。在AI技术快速发展的背景下,出版商对内容被大规模抓取的担忧日益加剧,但将矛头指向非营利性数字档案机构,实则可能造成不可逆的公共知识损失。互联网档案馆所保存的数字记录,不仅是新闻史的重要组成部分,也广泛用于学术研究、历史分析和公共监督。若此类存档被系统性阻断,将影响未来社会对历史事件的客观认知。从国际视角看,这一争议可能引发全球范围内对网络存档合法性的重新审视,尤其是在版权法与公共利益之间的平衡问题上。此外,美国作为全球数字技术与出版业中心,其政策动向可能影响其他国家的类似实践。因此,如何在保护创作者权益与维护公共知识库之间找到平衡,将成为未来数字治理的关键议题。