英政府Mythos AI测试展现网络安全威胁识别能力
英国政府下属机构AISI(人工智能安全研究所)近日发布报告,称其开发的Mythos AI模型在模拟网络渗透测试TLO(Targeted Lateral Movement and Objectives)中表现优异,成为“首个从头到尾完成TLO任务的模型”。
在32步渗透流程测试中,Mythos Preview平均完成22步,显着高于Claude 4.6的16步平均值。Anthropic新模型在10次尝试中仅成功3次。AISI指出,Mythos在“冷却塔”七步测试中仍面临挑战,该测试模拟对发电厂控制软件的破坏行为,但预计通过增加推理算力(超出当前1亿token预算)可进一步提升表现。
AISI强调,当前测试环境未包含真实世界中的主动防御系统和检测机制,且TLO测试设计包含特定漏洞,不完全反映现实场景。因此,该机构无法确认Mythos是否能攻破防护严密的系统。但报告警示,未来AI模型若具备类似或更优能力,可能对弱防护企业系统构成自动化攻击威胁,建议防御方应利用AI模型强化自身安全防护体系。
编辑点评
此次Mythos AI在TLO测试中的突破,标志着人工智能在自动化网络攻击模拟领域迈入新阶段。其在渗透步骤完成率上的显着优势,凸显AI在逻辑推理、工具调用和路径规划方面的进步。虽然当前测试环境与真实系统存在差距,但这一能力发展对全球网络防御体系构成潜在挑战。尤其在关键基础设施、中小企业等防御薄弱领域,自动化攻击的风险正在上升。从地缘政治角度看,该技术可能被用于网络战或间谍活动,加剧大国间数字安全博弈。未来,各国将加速AI驱动的防御系统建设,形成‘攻防AI化’趋势,网络安全格局或将重构。同时,该事件也凸显国际社会亟需制定AI安全使用规范,防止技术滥用。