# 互联网档案馆

AI数据中心扩张引发硬盘短缺 数字存档机构面临存储危机

因人工智能数据中心需求激增,全球硬盘及存储设备价格大幅上涨,导致互联网档案馆、维基媒体基金会等数字存档机构面临存储成本上升和设备短缺问题。部分高容量硬盘如28-30TB型号已难觅踪迹或价格暴涨。互联网档案馆创始人Brewster Kahle称,该机构每日新增超100TB数据,现有210PB存档需持续升级,存储困境已造成时间和资金成本增加。维基媒体基金会亦表示,自2025年底以来存储价格持续上涨,影响服务器采购和交付周期。西部数据称其2026年库存已售罄,美光则退出消费级市场,专注服务企业客户。

2026-05-09 01:06

研究发现2022年以来三分之一新网站由AI生成

一项由斯坦福大学、帝国理工学院和互联网档案馆研究人员联合开展的研究显示,自2022年以来,约三分之一的新网站由人工智能生成。该研究基于互联网档案馆数据,发表于论文《人工智能生成文本对互联网的影响》。研究指出,AI生成内容使网络文本整体变得更积极、更简洁,但可能降低语义和风格多样性及事实准确性。研究团队称,2025年中期,新发布网站中约35%被识别为AI生成或辅助生成,而2022年底ChatGPT推出前此比例为零。研究者警告,AI对互联网的快速渗透可能造成数字生态的结构性变化。

2026-04-28 08:03

互联网档案馆“时光机”面临严重威胁 多家媒体封锁爬虫访问

互联网档案馆(Internet Archive)的“时光机”(Wayback Machine)作为保存网页历史版本的重要工具,正面临严峻挑战。据分析,包括《今日美国》在内的23家主流新闻网站及社交平台Reddit已封锁其网络爬虫ia_archiverbot,阻碍网页存档。尽管这些媒体自身在报道中频繁使用“时光机”数据(如《今日美国》曾引用其追踪ICE政策变化),却禁止其存档自身内容。互联网档案馆负责人马克·格雷厄姆指出此行为矛盾。记者群体联署支持信,强调在传统纸质档案衰落背景下,“时光机”对保存新闻记录至关重要。该事件引发对数字信息保存机制与媒体责任的广泛讨论。

2026-04-13 23:03

互联网最强大存档工具面临危机

互联网档案馆(Internet Archive)的Wayback Machine因被多家主流媒体机构限制存档而面临挑战。包括《今日美国》、《纽约时报》和《卫报》在内的23家主流新闻网站已阻止其爬虫访问,部分媒体则通过技术手段限制访问。此举引发记者和倡导组织关注,超过100名记者联署支持Wayback Machine,称其在事实核查、历史研究和工会组织等方面不可或缺。尽管部分媒体以防止AI公司滥用内容为由进行限制,但该工具在监督报道和司法证据中的关键作用不可替代。若持续失去主要新闻源访问权限,数字历史记录可能面临永久性丢失风险。

2026-04-13 20:04

电子前沿基金会警告:出版商阻断互联网档案馆将危及历史记录保存

电子前沿基金会(EFF)指出,包括《纽约时报》在内的多家新闻出版机构近期开始使用技术手段阻止互联网档案馆(Internet Archive)抓取其网站内容,此举可能破坏长期以来由数字图书馆保存的公共历史记录。EFF认为,尽管出版商担忧人工智能公司滥用新闻内容进行模型训练,但封禁非营利性档案机构并非合理应对方式。互联网档案馆自1990年代中期起持续保存报纸等数字资料,已成为历史研究的重要资源。EFF强调,即使未来法院对AI训练中的版权问题作出裁决,也应保护网络存档的合法权利,避免因AI争议而永久性损毁公众历史记录。

2026-03-22 07:03