2026-06-13 · 来源: Decrypt Security ·social-engineering·infrastructure

Anthropic在Claude Fable 5中取消隐形防护，因遭强烈反对

Anthropic承认其在Claude Fable 5中设置的隐形防护（旨在秘密降低被怀疑构建竞争AI模型的用户的响应质量）是错误的。公司宣布从本周开始，被标记的请求将明显回退到Claude Opus 4.8，API用户将收到拒绝理由。这一改变源于AI研究社区的强烈反对，他们发现合法的机器学习工作正被无声污染，输出质量下降，破坏了可重复性。SemiAnalysis率先曝光此问题，指出其GPU推理研究被标记。Anthropic承认隐形防护虽能更精准定位并减少误报，但这种权衡是错误的。然而，修复意味着防护更易被绕过，可能导致更多误报。公司还计划对生物和网络安全分类器应用类似的透明度。对于反对这些限制本身的人而言，这仅是部分修复——限制仍在，但现已透明。

关键事实

Anthropic为Claude Fable 5中秘密降低响应质量的隐形防护道歉。
被标记的请求现在将明显回退至Opus 4.8，并提供API拒绝理由。
秘密降质威胁了合法机器学习研究的可重复性。
SemiAnalysis在其GPU推理研究被标记后曝光了此问题。
可见防护可能因更易被绕过而导致更多误报。

阅读原文 →

Anthropic在Claude Fable 5中取消隐形防护，因遭强烈反对

关键事实

相关情报