Anthropic限制Mythos AI发布以防范黑客利用模型发动网络攻击
Anthropic于2026年4月7日宣布推出先进人工智能模型Claude Mythos Preview,作为网络安全项目Project Glasswing的一部分,仅向选定企业开放。该模型擅长识别软件漏洞,Anthropic为防止恶意行为者滥用其能力,决定限制访问。
首批合作企业包括苹果、谷歌、微软、英伟达和亚马逊云服务,另有40多家公司参与,其中包括CrowdStrike和Palo Alto Networks。Anthropic表示,这些企业均负责构建或维护关键软件基础设施,将用于保护第一方及开源系统安全。
Anthropic称Claude Mythos Preview为通用模型,其网络安全能力源于强大的编码与推理技能,而非专项训练。公司不计划向公众开放该模型,目标是探索未来规模化部署的可能性。公司承诺提供最高1亿美元的使用额度支持测试,超出部分由合作方自行承担费用。
项目名称Project Glasswing由员工选定,以透明蝴蝶比喻软件漏洞的隐蔽性。模型曾在测试中发现OpenBSD系统一个存在27年的漏洞,该系统以安全性着称。Anthropic首席执行官Dario Amodei在X平台发文称,若部署得当,或可构建更安全的互联网环境。
公司正与美国政府官员就模型的网络安全能力进行持续对话。Anthropic首席前沿红队网络安全负责人Newton Cheng表示,公司希望合作方提前适应AI安全能力,避免模型被恶意利用。他强调,AI能力提升对网络安全领域风险显着,需保持高度关注。
此前《财富》杂志在公共数据缓存中发现模型描述,引发网络安全股短期波动。当天iShares网络安全ETF在盘中交易中基本持平。Anthropic于2021年由从OpenAI离职的团队创立,以负责任AI部署着称,该项目发布正值其与美国防部安全争议公开后不久。
编辑点评
Anthropic推出Claude Mythos Preview并限制其发布,标志着AI安全治理进入新阶段。该模型具备高精度漏洞检测能力,若被恶意滥用,可能成为网络攻击的强大工具。因此,Anthropic采取‘控制式发布’策略,优先与关键科技企业合作,既可积累安全应用经验,又能避免技术外泄。此举反映全球对AI双刃剑效应的共识加深,尤其在网络安全领域,AI的攻防能力正快速演化。从地缘政治角度看,美国科技企业主导此类敏感AI技术的部署,可能加剧国际技术竞争,尤其在与中俄等国的技术安全博弈中,AI安全能力或成为新的战略制高点。未来,此类模型的监管框架将面临挑战,国际社会可能需要建立类似‘核不扩散’的AI安全协议,以防止技术落入非国家行为体或敌对势力手中。该项目也可能推动全球网络安全标准升级,促使各国加强关键基础设施的AI防御体系建设。