英政府Mythos AI测试展现网络安全威胁识别能力
英国政府下属机构AISI发布的测试结果显示,其开发的Mythos AI模型在模拟网络渗透任务TLO中表现突出,成为首个从头到尾完成该任务的模型。在32步渗透测试中,Mythos平均完成22步,显着高于Claude 4.6的16步平均值,而Anthropic新模型仅在10次尝试中成功3次。尽管Mythos在更复杂的‘冷却塔’测试中仍显不足,且测试环境未模拟真实防御机制,AISI仍警示,未来AI模型可能对弱防护企业系统构成自主攻击威胁,呼吁加强AI驱动的防御体系建设。