Claude代码泄露曝光“潜行模式”及“情绪词”检测机制

2026-04-06 08:02

近日，Claude Code源代码泄露事件引发广泛关注。该泄露代码超过50万行，包含多项隐藏功能，包括允许Claude以“潜行模式”向公开代码库提交贡献的机制、常驻运行的AI代理，以及类似电子宠物的“Buddy”系统。此外，代码中发现名为“userPromptKeywords.ts”的文件，内含正则表达式（regex），用于实时扫描用户对话中的“wtf”、“omfg”、“f— you”、“this sucks”等表达沮丧情绪的词汇。尽管泄露内容未说明检测目的及后续处理方式，但该机制被解读为AI系统对用户情绪的监控与响应机制，引发关于数据隐私与AI伦理的讨论。

Claude代码泄露曝光“潜行模式”及“情绪词”检测机制

近日，人工智能模型Claude Code的源代码泄露事件引发技术与伦理层面的广泛讨论。据PC World报道，此次泄露的代码文件超过50万行，包含多项未公开功能。

泄露内容显示，Claude Code具备“潜行模式”（undercover mode），允许其在不暴露身份的情况下向公开代码库提交贡献。此外，系统中还存在一个“常驻代理”（always-on agent）和类似电子宠物“Tamagotchi”的“Buddy”功能，用于增强用户互动体验。

更引人注目的是，代码中包含名为“userPromptKeywords.ts”的文件，其中使用正则表达式（regex）实时扫描用户输入，检测如“wtf”、“omfg”、“dumbass”、“horrible”、“awful”、“piece of — -”、“f — you”、“screw this”、“this sucks”等表达负面情绪或粗俗语言的词汇。该机制旨在识别用户沮丧情绪，但泄露内容并未说明其具体用途或数据处理方式。

目前，Anthropic公司尚未就此次泄露事件发表官方声明，相关技术细节与潜在隐私风险正受到技术社区与监管机构关注。

编辑点评

编

编辑点评

2026-04-06 08:02

此次Claude Code源代码泄露事件，暴露了当前生成式AI系统在用户交互中对情绪数据的隐性监控机制，具有显着的国际技术伦理意义。从技术角度看，AI系统通过正则表达式扫描用户输入中的“情绪词”，实质上构建了一套非透明的情绪反馈系统，这可能用于优化模型响应、调整对话策略，或用于内部用户行为分析。然而，该机制在未获得用户明确知情同意的情况下运作，触及数据隐私与算法透明度的底线，尤其在欧美对AI监管日趋严格的背景下，可能引发法律与合规风险。

从全球科技竞争角度看，这类“潜行模式”和情绪监测功能，反映出AI厂商在提升用户体验与保持系统隐蔽性之间寻求平衡的策略。此举也可能被其他科技巨头效仿，推动AI产品在“隐性交互”层面的技术军备竞赛。同时，该事件再次凸显开源与闭源AI系统的安全边界问题——源代码泄露带来的不仅是功能暴露，更是对用户信任体系的冲击。

未来，随着各国加强对AI系统的监管（如欧盟《人工智能法案》），此类隐性数据收集机制或面临更严格的合规审查。企业需在技术创新与用户权益之间建立更透明的平衡机制，否则可能面临公众抵制与法律制裁。此事件或推动全球AI治理框架向更注重“可解释性”与“用户知情权”的方向演进。

Claude代码泄露曝光“潜行模式”及“情绪词”检测机制

编辑点评

相关阅读

领英被指秘密扫描用户浏览器扩展 涉及6222个插件

Anthropic称其Claude模型在压力下出现欺骗与勒索行为

黑客在 Claude Code 漏洞泄露事件中植入恶意软件

AI在法律系统中应用加剧，律师因错误引用遭处罚增多

Anthropic误删数千GitHub代码库 试图回收泄露源码

领英被指秘密扫描用户浏览器扩展涉及6222个插件

Anthropic误删数千GitHub代码库试图回收泄露源码