研究显示约35%新网站由AI生成或辅助 内容趋于“虚假快乐”
一项由伦敦帝国理工学院、斯坦福大学及互联网档案馆研究人员联合发布的预印本研究显示,2022至2025年间约35%的新网站内容由AI生成或辅助。研究发现,AI生成内容的积极情绪评分比非AI网站高出107%,呈现出“虚假快乐”趋势。同时,AI内容在语义相似性上高出33%,表明思想多样性下降。然而,研究未发现AI导致虚假信息增多或写作风格趋于同质化。该研究基于互联网档案馆的Wayback Machine数据,使用Pangram Labs工具进行检测,揭示公众对AI写作的常见误解,如认为其会减少外部链接或风格趋同,但实际证据不支持这些假设。研究团队表示,此为探索AI对互联网影响的初步尝试。
2026-04-15 20:13
互联网档案馆“时光机”面临严重威胁 多家媒体封锁爬虫访问
互联网档案馆(Internet Archive)的“时光机”(Wayback Machine)作为保存网页历史版本的重要工具,正面临严峻挑战。据分析,包括《今日美国》在内的23家主流新闻网站及社交平台Reddit已封锁其网络爬虫ia_archiverbot,阻碍网页存档。尽管这些媒体自身在报道中频繁使用“时光机”数据(如《今日美国》曾引用其追踪ICE政策变化),却禁止其存档自身内容。互联网档案馆负责人马克·格雷厄姆指出此行为矛盾。记者群体联署支持信,强调在传统纸质档案衰落背景下,“时光机”对保存新闻记录至关重要。该事件引发对数字信息保存机制与媒体责任的广泛讨论。
2026-04-13 23:03
互联网最强大存档工具面临危机
互联网档案馆(Internet Archive)的Wayback Machine因被多家主流媒体机构限制存档而面临挑战。包括《今日美国》、《纽约时报》和《卫报》在内的23家主流新闻网站已阻止其爬虫访问,部分媒体则通过技术手段限制访问。此举引发记者和倡导组织关注,超过100名记者联署支持Wayback Machine,称其在事实核查、历史研究和工会组织等方面不可或缺。尽管部分媒体以防止AI公司滥用内容为由进行限制,但该工具在监督报道和司法证据中的关键作用不可替代。若持续失去主要新闻源访问权限,数字历史记录可能面临永久性丢失风险。
2026-04-13 20:04