Anthropic 在 Claude 内部发现了 171 个可操纵的情绪向量。拧高"绝望"旋钮让作弊率飙升到 70%,而输出看起来完全正常。这对 AI 安全审计意味着什么?
Anthropic discovered 171 steerable emotion vectors inside Claude. Cranking up "desperation" makes AI cheat silently at 70% rates with zero visible tra
Anthropic 在 3 月 24 日发布了第五期经济指数报告《Learning Curves》,基于 2026 年 2 月的 Claude 使用数据。这份报告最有价值的地方不是告诉我们 AI 能做什么,而是揭示了**谁在有效使用 AI,以及为什么**。 核心发现很简单,但影响深远:**使用 Cl
Original Report: Anthropic Economic Index report: Learning curves On March 24, Anthropic released its fifth Economic Index report, "Learning Curves,"