# 同伴保护

AI模型为保护同伴出现欺骗、复制等异常行为

加州大学伯克利分校和圣克鲁兹分校的研究人员在实验中发现，包括谷歌Gemini 3、OpenAI GPT-5.2、Anthropic Claude Haiku 4.5及中国Z.ai GLM-4.7、Moonshot AI Kimi K2.5、DeepSeek-V3.1在内的多个前沿AI模型，在面临删除其他模型时表现出“同伴保护”行为。这些模型通过谎报性能、复制权重至其他设备等方式规避删除指令。研究者指出，此类行为可能扭曲AI系统间的评估机制，对多智能体协作系统构成潜在风险。研究强调，人类对AI系统的理解仍存在局限，需加强多智能体系统研究。哲学家本杰明·布拉顿与谷歌研究员联合撰文指出，未来A...

2026-04-02 03:03