Anthropic 的自然语言自编码器将 LLM 的内部激活值转化为人类可读文本。本文深入解析其架构、安全应用(评估意识检测、审计游戏)以及面向 Qwen、Gemma、Llama 模型的开源发布。
Anthropic's Natural Language Autoencoders convert opaque LLM activations into human-readable text. This deep dive covers the architecture, safety appl
"Anthropic 开展了一项为期一周的实验,让 Claude 在 4 个平行市场中自主交易。Opus Agent 卖出商品的价格比 Haiku Agent 高出 70%。无论是 Agent 还是人类,都未察觉其中存在的问题。"
"Anthropic ran a week-long experiment where Claude autonomously traded items across 4 parallel markets. Opus agents sold items for 70% more than Haiku
Claude Opus 4.7 全面技术解析:87.6% SWE-bench Verified、+14.6 MCP-Atlas、+44 XBOW、自验证行为、高分辨率视觉、xhigh effort level、迁移指南、多模型路由策略。
Claude Opus 4.7 analysis: 87.6% on SWE-bench Verified, +10.9 on SWE-bench Pro, +44 on XBOW Vision. The most comprehensive technical breakdown availabl
"2026 年的 Anthropic 已不再只是模型公司。完整地图:3 个模型层级、5 档订阅计划、3 款 Agent 产品、以及正在增长的企业级产品栈。"
"Anthropic in 2026 is no longer just a model company. Here's the complete map: 3 model tiers, 5 subscription plans, 3 agent products, and a growing en
"Claude Sonnet 4.6 在 SWE-bench Verified 上达到 79.6%,定价 $3/$15 每百万 token,与 Opus 4.6 仅差 1.2 分但成本只有 60%。深度解析 Anthropic 如何在中端模型上实现前沿编程和 Agent 性能。"
"Claude Sonnet 4.6 delivers 79.6% on SWE-bench Verified at $3/$15 per million tokens — within 1.2 points of Opus 4.6 at 60% of the cost. A technical d