当一个 AI Agent 可以在你的机器上执行任意 shell 命令时,问题不在于它会不会犯错,而在于你如何控制爆炸半径。OpenAI 的 Codex 赋予编码 Agent 正是这种能力:读取文件、写入代码、运行测试、安装依赖、执行 shell 命令。Agent 需要真实的系统访问权限才能完成有意义
2026 年 3 月 27 日,Anthropic 因 CMS 配置错误泄露了约 3,000 份未发布资产。其中一份草稿描述了代号 Mythos(内部称 Capybara)的下一代模型,声称在 coding、reasoning 和 cybersecurity 上有显著进展,且在网络安全能力上"far
2026 年 3 月 27 日,Anthropic 因 CMS 配置错误泄露了约 3,000 份未发布资产。其中一份草稿描述了代号 Mythos(内部称 Capybara)的下一代模型,声称在 coding、reasoning 和 cybersecurity 上有显著进展,且在网络安全能力上"far