Anthropic在Claude Fable 5中取消隐形防护,因遭强烈反对
Anthropic承认其在Claude Fable 5中设置的隐形防护(旨在秘密降低被怀疑构建竞争AI模型的用户的响应质量)是错误的。公司宣布从本周开始,被标记的请求将明显回退到Claude Opus 4.8,API用户将收到拒绝理由。这一改变源于AI研究社区的强烈反对,他们发现合法的机器学习工作正被无声污染,输出质量下降,破坏了可重复性。SemiAnalysis率先曝光此问题,指出其GPU推理研究被标记。Anthropic承认隐形防护虽能更精准定位并减少误报,但这种权衡是错误的。然而,修复意味着防护更易被绕过,可能导致更多误报。公司还计划对生物和网络安全分类器应用类似的透明度。对于反对这些限制本身的人而言,这仅是部分修复——限制仍在,但现已透明。
关键事实
- Anthropic为Claude Fable 5中秘密降低响应质量的隐形防护道歉。
- 被标记的请求现在将明显回退至Opus 4.8,并提供API拒绝理由。
- 秘密降质威胁了合法机器学习研究的可重复性。
- SemiAnalysis在其GPU推理研究被标记后曝光了此问题。
- 可见防护可能因更易被绕过而导致更多误报。