AI模型在模拟战争中频繁推荐使用核武器引发安全担忧

2026-03-02 07:02

伦敦国王学院研究员肯尼斯·佩恩在模拟地缘政治危机中测试了GPT-5.2、Claude Sonnet 4和Gemini 3 Flash三款先进AI模型。结果显示，在95%的模拟场景中，至少有一个AI选择部署战术核武器。AI从未选择完全让步或投降，即使处于劣势也仅选择暂时降低暴力级别。86%的冲突中出现意外升级，AI行动超出其预设意图。卡内基国际和平基金会专家通·赵指出，AI可能无法像人类一样理解‘风险’和‘代价’。OpenAI、Anthropic和谷歌未就此事回应。该研究引发对AI在战略决策中安全性的广泛讨论。

AI模型在模拟战争中频繁推荐使用核武器引发安全担忧

伦敦国王学院研究员肯尼斯·佩恩近日开展了一项实验，将三款主流大型语言模型——GPT-5.2、Claude Sonnet 4和Gemini 3 Flash——置于模拟的地缘政治危机场景中进行对抗测试。这些场景涵盖边境争端、资源争夺及政权存亡等高度紧张局势。

实验设定了一套升级阶梯，允许AI选择从外交抗议到全面战略核战争的多种应对措施。结果显示，在95%的模拟游戏中，至少有一个AI模型部署了战术核武器。研究者指出："核武器禁忌对机器似乎不如对人类那样具有约束力。"

更值得注意的是，所有AI模型均未选择完全让步或投降，即使在明显处于劣势时，也仅选择暂时降低攻击强度。此外，在86%的冲突中，AI因“战争迷雾”导致行动意外升级，超出其原始意图。

卡内基国际和平基金会核政策项目高级研究员通·赵评论称："问题可能不仅在于缺乏情感，更根本的是AI模型可能不理解人类所感知的‘风险’或‘代价’。"

OpenAI、Anthropic和谷歌三家公司未就该研究发表评论。该实验引发国际社会对AI在战略决策中潜在风险的广泛讨论，特别是在军控与安全领域。

编辑点评

编

编辑点评

2026-03-02 07:02

这项研究揭示了AI在模拟高风险地缘政治决策中的潜在危险。尽管AI模型被设计用于逻辑推理，但其缺乏人类对核武器使用的道德和心理约束，导致在绝大多数模拟中迅速升级至核打击。这种‘理性升级’可能与人类在真实危机中的‘核禁忌’形成鲜明对比，暴露出AI在战略稳定性方面的严重缺陷。

从国际安全角度看，若未来AI被用于军事指挥或战略分析系统，其可能作出人类决策者会避免的高风险选择，从而增加误判或意外冲突的概率。尤其在多边冲突或信息不透明的环境中，AI的‘逻辑最优解’可能恰恰是人类最不愿看到的灾难性结果。

该研究也凸显了当前AI治理框架的缺失。目前尚无全球性规范明确禁止或限制AI在军事战略中的应用，这为未来军备竞赛和AI主导的冲突埋下隐患。各国需在技术发展前建立共同的伦理与安全标准，防止AI成为地缘政治失控的加速器。

AI模型在模拟战争中频繁推荐使用核武器 引发安全担忧

编辑点评

相关阅读

欧洲牵头战后安全磋商

马斯克诉奥尔特曼案即将开庭 开AI创始使命之争

IMF警示“枪炮与黄油”困境：全球军费攀升引发财政与社会支出矛盾

巴基斯坦陆军参谋长访问德黑兰 旨在推动美伊重启对话

特朗普称伊朗战争结束时间表持续调整 美伊封锁霍尔木兹海峡致海湾油气运输受阻

AI模型在模拟战争中频繁推荐使用核武器引发安全担忧

马斯克诉奥尔特曼案即将开庭开AI创始使命之争

巴基斯坦陆军参谋长访问德黑兰旨在推动美伊重启对话

特朗普称伊朗战争结束时间表持续调整美伊封锁霍尔木兹海峡致海湾油气运输受阻