Anthropic推出Claude Code“自动模式”增强安全性

2026-03-25 20:07

Anthropic公司近日推出Claude Code的“自动模式”功能，允许AI在用户授权下自主执行任务，同时通过风险检测机制阻止潜在危险操作。该模式旨在平衡用户对AI自主性的需求与安全风险，防止AI执行如删除文件、传输敏感数据或运行恶意代码等未经授权的操作。目前该功能仅限Team计划用户在研究预览中使用，未来几天将扩展至企业用户和API用户。Anthropic强调该工具仍处于实验阶段，建议开发者在隔离环境中使用。

Anthropic推出Claude Code“自动模式”增强安全性

Anthropic公司于2026年3月25日宣布，其AI编程工具Claude Code新增“自动模式”功能，允许AI在用户授权范围内独立执行任务，同时通过内置安全机制拦截潜在高风险操作。

该功能旨在为用户提供一种介于全程人工干预与完全AI自主之间的安全折中方案。Claude Code此前已具备按权限独立执行代码的能力，但存在误删文件、发送敏感信息或执行恶意指令等风险。自动模式通过实时检测和拦截高风险行为，防止未经授权的操作发生，并提示AI重新尝试或请求用户介入。

目前，自动模式仅向Team计划用户开放，作为研究预览功能。Anthropic表示，将在未来几天内扩展至企业用户及API用户。公司同时强调，该功能仍处于实验阶段，无法完全消除风险，建议开发人员在隔离环境中测试使用。

Anthropic首席技术官表示，该功能是AI代理（AI Agents）安全应用的重要进步，有助于提升AI在实际开发场景中的可信度与实用性。

编辑点评

编

编辑点评

2026-03-25 20:07

Claude Code自动模式的推出标志着AI代理技术在安全性与实用性之间寻求平衡的重要进展。当前，AI在软件开发、自动化运维等领域的应用日益广泛，但其自主决策带来的安全风险也备受关注。此功能通过风险拦截机制，在不显着降低效率的前提下提升可控性，体现了技术提供商对责任伦理的重视。

从全球科技竞争角度看，AI安全框架的完善已成为各国技术标准和监管政策的重要议题。Anthropic此举可能影响AI开发工具市场格局，推动其他厂商跟进类似安全机制，从而提升整个行业对AI代理风险的治理水平。

长远来看，此类技术演进将加速AI从辅助工具向可信代理的转型，尤其在金融、医疗等高风险行业具有潜在应用价值。但需警惕技术过度承诺，当前仍属实验阶段，其在复杂场景下的误判率、边界定义等问题仍需持续验证。

Anthropic推出Claude Code“自动模式”增强安全性

编辑点评

相关阅读

软银愿景基金年度盈利460亿美元 主要受益于对OpenAI巨额投资

以太坊社区推出Clear Signing功能终结盲签风险

比特币或因AI竞赛与战争推动货币宽松而飙升，Hayes预测年内重返历史高点

OpenAI首席执行官阿尔特曼作证称马斯克曾试图控制公司

奥特曼在庭审中表现可信，但马斯克的报复可能才刚开始

软银愿景基金年度盈利460亿美元主要受益于对OpenAI巨额投资