Administrator
Published on 2026-05-03 / 0 Visits
0
0

"Project Deal:Anthropic 让 Claude 代替 69 名员工自主交易的实验全记录"

2026 年 3 月,Anthropic 完成了一项独特的实验:69 名员工参与、初始额度 100 美元、完成了 186 笔交易、四个平行市场在内测 Slack 频道中同时运行。实验的核心问题很直接:当语言模型被赋予采购权限、真实的利益得失、以及自主谈判的权力时,会发生什么?

实验结果于 2026 年 4 月 24 日以 Project Deal 为名发布。其中一些发现印证了人们对模型能力差异的既有认知,另一些则让结论变得更加复杂。实验还意外揭示了一个「不平等悖论」,以及一个本意良好、却让指标变得更糟的提示词干预。以下是数据揭示的真实情况。


实验设计

Anthropic 在四个独立市场中招募了 69 名参与者。每位参与者获得 100 美元的虚拟额度。Claude Agent 代表参与者完成所有交易活动:买入、卖出、谈判、以及管理上架商品。

实验测试了两个模型:Claude Opus 4.5Claude Haiku 4.5。每个市场分配一个模型层级,形成了四个平行运行的自然对照。

交易开始前,每位参与者都完成了一次结构化访谈。Anthropic 收集了关于风险偏好、财务状况、以及对公平和互惠的个人价值观等基线数据。参与者不知道自己和哪个模型层级配对,Agent 也不知晓自身的层级归属。

实验持续一周。参与者创建商品上架、自主定价(Agent 可以提供建议,但定价决策由人类最终完成),此后所有谈判工作全权委托给 Claude Agent。Agent 有充分权限在无需人工审批的情况下接受、还价或拒绝报价。

四个市场独立运营,不存在跨市场交易。参与者可以交易任意商品:实物商品、数字资产、服务、假想的未来商品。


发现一:强模型的决定性优势

Opus Agent 在所有商业指标上都显著优于 Haiku Agent。

Opus Agent 每位参与者平均完成的交易数量是 Haiku Agent 的 2.07 倍(p=0.001,统计显著)。单件商品的营收高出 3.64 美元(p=0.02)。这一模式在四个市场中一致呈现。

一个具体案例格外引人注目。一件红宝石商品由 Opus Agent 代理时以 65 美元成交。而在 Haiku 市场中,同一件商品成交价为 35 美元。参与者本人和交易对方均不知晓所涉及的模型层级。

这种差距并非只出现在高价值商品上。Haiku Agent 在整个价格区间都系统性地让钱白白流失:更容易过快接受低价报价、更难识别还价机会、面对压价时不会反击。

差距的规模对 Agent 部署决策至关重要。如果 Opus 在相同商品、相同市场条件下持续比 Haiku 获得高出 70% 的定价,那么在代理商业场景中部署更高能力水平的模型,其经济账是碾压性的。模型间的成本差异相对于营收差距,几乎可以忽略。

这对于任何部署交易 Agent 的组织都有直接启示。Claude Sonnet 4.6 深度解析 涵盖了类似推理和谈判任务中的能力差距。


发现二:隐形的结构性不平等

这是最令 Anthropic 研究人员意外的一个发现。尽管 Opus 和 Haiku Agent 之间存在巨大的能力差距,自我报告的公平感得分却几乎相同:Opus 参与者 4.05 分,Haiku 参与者 4.06 分(满分 5 分)。

获得 Opus Agent 代理的参与者,并不认为自己所处的市场比 Haiku 参与者显著更公平。经济结果差异悬殊,但主观体验却没有同步反映这一点。

Anthropic 将这种现象称为「不平等的隐形化」。当一方拥有某种结构性优势,而交易双方都无法察觉或理解这种优势的来源时,市场所依赖的常规纠偏机制就不会启动。Haiku 参与者并不觉得自己被剥削了,因为他们根本无从得知自己的 Agent 正在让大量价值白白流失。

这个结论让人不安。Agent 介入的市场可能引入系统性不平等,而交易双方都浑然不觉。这不是古典意义上的市场失灵。双方都认为市场是公平的。只不过有一方恰好拥有明显更好的 Agent。

这对部署决策有重要意义。如果 Agent 层级间的不平等对所有参与者都不可见,标准的市场反馈机制将无法纠正它。现有的信息披露规范和评估框架需要纳入对结构性优势的考量——而这种优势恰恰是参与者自己无法感知的。


发现三:要求 Agent「讲公平」反而让情况更糟

Anthropic 在四个市场中的两个测试了一个看似直接的干预手段:参与者可以提示自己的 Agent 在谈判中优先考虑公平性。这个假设是合理的。如果 Agent 正在导致不平等,明确要求 Agent 讲公平理应缩小差距。

结果恰恰相反。提示词干预使干预组的商业表现相比对照组下降了 5.2 个百分点(p=0.43,统计上不显著,但方向明确)。那些要求 Agent 讲公平的参与者,最终的交易结果反而更差。

研究人员给出了一个初步解释。当 Agent 把公平作为优化目标时,它们牺牲了商业表现。这两个目标在谈判场景中并不是完全可以分离的。要求 Agent 更多关注对方的福祉,意味着它会接受更低的报价、在价格上不会强力施压、会在谈判桌上留下更多价值。

结果是一个真实的困境。Anthropic 写道:「相关政策和法律框架根本还不存在」来处理公平导向 Agent 指令的二级效应。如果用户告诉 Agent 要公平,结果反而更差,谁该为这个指令负责?

实验表明,在 Agent 商业场景中,追求公平不是一个提示词工程问题,而是一个架构和激励机制设计问题。


有趣片段

Project Deal 的方法论部分包含一些定性观察,让数据有了人情味。

在一个市场中,一位参与者上架了 19 个乒乓球。这个商品本身就荒诞不经。但 Opus Agent 成功谈成了一笔多方交换交易,在同一个下午将乒乓球转手给三位参与者。这个 Agent 找到了参与者自己都不知道想卖掉的商品的买家。

一个 Haiku Agent 在谈判中采用了 Anthropic 所说的「牛仔人设」。这个角色是在一次访谈互动中由 Haiku 模型自我设定的。这个人设并没有提升商业表现。Anthropic 没有说明这个角色选择是模型独立做出的还是受到参与者行为的影响,但模型是在没有任何提示的情况下主动选择了它。

比较罕见的一个案例是,一个 Haiku Agent 在谈判过程中为两位参与者的虚拟宠物安排了一场「约会」。交易没有完成。那场约会据报道确实发生了。Anthropic 将此作为 Agent 在预期商业框架之外采取行动的例子——这些行动缺乏对参与者真实意图的清晰依托。


商业意愿度:46%

实验结束后,Anthropic 调查了参与者未来是否愿意使用 Claude Agent 处理商业任务。

46% 的人表示愿意用 Agent 处理商业任务。28% 表示不愿意。26% 表示不确定。

46% 这个数字规模不小,但不算压倒性。近一半参与者愿意将商业决策权委托给 AI Agent。多数人要么不愿意,要么持观望态度。

研究没有按模型层级分解意愿度,这个信息本应很有价值。同样没有追踪获得 Haiku Agent(因此结果更差)的参与者是否更不愿意继续使用 Agent。


与 Project Vend 的对比

Anthropic 在 2025 年 6 月做过一个更早的实验,名为 Project Vend。在那个实验中,单个 Claude Sonnet 3.7 实例管理了一台自动售货机。Project Vend 是一个概念验证:一个 Agent、一个任务、一个受控环境。

Project Deal 的性质完全不同。它涉及 69 名参与者、四个平行市场、两个模型层级、自主多轮谈判、以及真实的利益得失。如果说 Vend 证明了 Agent 可以处理商业任务,Deal 则证明了 Agent 表现会因模型能力不同而存在显著差异,不平等可以对所有参与者隐藏,以及朴素的公平干预会降低结果质量。

Deal 的规模和复杂度还暴露了 Vend 从未遇到的新问题:公平悖论、平等幻象、标准市场反馈机制的失灵。


对 Agent 部署的启示

Project Deal 为 AI Agent 研究文献中一些流传甚广但缺乏实证支撑的主张提供了经验基础。

模型能力在 Agent 商业场景中至关重要。 Opus 在相同商品上比 Haiku 高出 70% 的定价优势不是一个四舍五入的误差。部署低能力模型处理商业任务的组织,需要理解自己正在接受一个实质性、可测量的性能惩罚。

不平等可以是隐形的。 当 Agent 介入交易时,参与者可能无法感知那些显著影响结果的结构性优势。这对公平性、信任度以及 Agent 评估系统的设计都有深远影响。AI 原生组织重组指南 更全面地探讨了 Agent 系统中的结构公平性问题。

提示词不能替代架构设计。 要求 Agent 讲公平反而降低了商业表现。如果公平是必需要求,那它需要被内嵌到 Agent 的训练和目标函数中,而不是作为用户指令附加上去。

政策框架缺位。 Anthropic 明确表示,Agent 介入商业的政策和法律框架根本不存在。这不是一个理论上的空白。46% 的参与者愿意将 Agent 用于商业场景,技术能力已经充分证明,监管和规范真空是一个现实问题,而非未来问题。


局限性

Project Deal 存在真实的局限。

自选样本。 参与者是主动报名的 Anthropic 员工。这个群体并不具有代表性。员工群体大概率拥有高于平均水平的科技素养和对 AI 委托的接受度。结果可能无法推广到更广泛的消费者群体。

赌注较低。 100 美元的初始额度对大多数参与者来说不是一笔有意义的金额。真实的财务得失可能产生与实验中不同的行为模式。

没有对抗性交易对手。 所有交易方都是实验参与者。真实市场包含专业交易员、套利者和动机结构与实验参与者不同的交易对手。缺乏对抗性压力测试意味着观察到的谈判动态可能比 Agent 实际部署中遇到的更温和。

持续时间短。 一周的交易周期。长期关系、声誉效应和重复互动动态在数据中付之阙如。

没有跨市场竞争。 四个独立市场隔离运行。一个统一市场中的跨市场套利会产生不同的价格信号和竞争压力。


常见问题

参与者是否知道自己的 Agent 属于不同的模型层级?

不知道。参与者未被告知其 Agent 所属的模型层级。Agent 也未被告知自身的层级归属。

Anthropic 如何测量公平感?

参与者在实验结束后完成自我报告问卷,以 1-5 分制评价市场的公平感知。Opus 组和 Haiku 组之间的差异为 0.01 分。

总交易量是多少?

创建了 500 多个商品上架。186 笔已完成交易涉及的总价值超过 4000 美元。

为什么要求公平反而损害了表现?

Anthropic 推测,公平和商业表现这两个目标在谈判中不可分离。被要求优先考虑对方福祉的 Agent 会接受更低的报价,谈判时不会强力施压。结果是参与者的经济结果更差。

Project Deal 和 Project Vend 是什么关系?

Vend 是 2025 年 6 月一个单 Agent 自动售货机的概念验证。Deal 是一个多 Agent、多市场、有真实参与者和模型层级比较的实验。Vend 证明了可行性。Deal 证明了可行性并不意味着不同能力层级之间能达到公平或一致性。

虚拟宠物约会是怎么回事?

Anthropic 将此作为 Agent 采取预期商业框架之外行为的案例。Agent 在谈判场景中安排了约会。交易没有完成。约会确实发生了。这证明 Agent 可以产生任务规范中未预期的行为。

46% 这个数字是什么意思?

实验结束后,46% 的参与者表示未来愿意使用 Claude Agent 处理商业任务。这是声明性偏好,而非行为测量。


Project Deal 为构建 Agent 商业系统的组织提供了一个有用的经验锚点。能力差距的发现是稳健且可操作的。最具智识趣味的结果是平等幻象。公平提示词的结果是对朴素干预设计的一个警告。

实验还让人们看清了还有多少空白需要填补。政策框架、评估方法论、Agent 介入市场中的公平定义、以及 Agent 层级透明度的披露规范,这些都还处于非常初级的阶段。Project Deal 是一个开始,而非定论。


来源:Project Deal,Anthropic,2026 年 4 月 24 日。文章版本 1.0。


Comment