Anthropic发布Claude Mythos模型引发全球网络安全关注
美国人工智能公司Anthropic于2026年4月8日宣布推出新型大型语言模型Claude Mythos Preview,称其在网络安全领域表现远超现有模型,具备自主发现和利用零日漏洞的能力,涉及主要操作系统和浏览器,可能重塑全球网络安全格局。
公司同时启动Project Glasswing项目,邀请包括竞争对手在内的关键机构参与测试,以保护全球关键软件基础设施。Anthropic表示,该模型发现数千个高危漏洞,需通过受控环境进行验证与修复。公司强调,模型能力提升主要源于人类研究,而非AI自我迭代。
该消息引发国际关注,美联储主席杰罗姆·鲍威尔与财政部长斯科特·贝森特紧急召集银行业高管商讨应对。《纽约时报》专栏作家托马斯·弗里德曼警告称,未来可能有青少年利用该模型攻击电网等关键基础设施。
然而,部分专家质疑其为营销噱头。AI安全工程师海迪·克哈夫指出,Anthropic未公布关键数据,如误报率、与现有工具对比及人工复核程度。AI专家加里·马库斯最初持观望态度,后表示该模型“远未达到最初预期的恐怖程度”。
尽管存在争议,英国AI安全研究所(AISI)独立测试显示,Claude Mythos在多项网络安全测试中超越所有现有前沿模型,能够攻击安全防护薄弱的系统。AISI认为,此类模型能力将推动更多类似工具出现。
专家普遍认为,尽管模型未达AGI水平,但其自动化漏洞发现能力构成真实威胁,尤其对攻击者而言。然而,防御方同样可利用此类工具提升安全水平。Anthropic强调,短期应采取谨慎策略,如Project Glasswing所示范的受控访问模式,长期则可能增强整体网络安全。
目前,Anthropic尚未回应媒体关于数据透明度的质疑,承诺将在漏洞修复后逐步公布更多信息。
专家观点分歧
部分学者认为,Anthropic此举兼具营销与责任双重属性。Gen公司首席AI与创新官豪伊·徐表示,尽管个人不担忧青少年攻击电网,但安全基础设施滞后于AI发展,风险不容忽视。斯坦福AI研究员迪夫·加尔认为,限制访问是合理选择,避免无管控发布带来的更大风险。
网络安全公司Remedio创始人塔尔·科尔伦德称,该模型代表“企业级戏剧”,但其自动化漏洞发现能力确实存在,且当前行业已面临工具泛滥问题,真正挑战在于安全响应能力不足。
模型能力与局限
根据模型卡,Claude Mythos在ECI综合评分中显着超越Claude Opus 4.6。研究科学家尼古拉斯·卡林尼表示,其在Linux系统中发现用户权限提升漏洞,可在无权限情况下获得管理员权限。但AISI也指出,该模型在真实世界应用中存在局限,如攻击链构建复杂度高,需专业知识支持。
总体而言,Claude Mythos代表AI在网络安全领域的重大进展,但其战略意义仍需结合防御演进与政策监管综合评估。
编辑点评
Claude Mythos的发布标志着人工智能在网络安全领域的实质性突破,其自动化漏洞发现能力对全球数字基础设施构成双重影响——既是攻击者的新武器,也是防御者的强大工具。从国际角度来看,该事件凸显AI技术演进与全球安全治理之间的脱节。若此类模型被恶意滥用,可能加速网络攻击的规模化、自动化趋势,尤其在关键基础设施领域。但同时,如AISI测试所示,防御方同样可利用此类技术提升漏洞响应速度,形成新的安全平衡点。美国政府高层紧急介入,反映出对AI安全风险的系统性担忧,可能推动全球范围内加强AI监管框架的建设。此外,Anthropic选择封闭测试与邀请竞争对手参与的策略,显示其在技术领先与行业协作之间的权衡,这或将成为未来AI安全治理的范式。长远来看,此类模型的普及将倒逼各国提升网络安全基础设施韧性,同时可能催生新的国际技术标准与合作机制。尽管存在营销争议,但其技术能力已获得独立机构验证,因此不能简单视为噱头,而应被视为全球科技竞争与安全博弈的新前沿。