Google DeepMind 的 Gemini Robotics 是第一个将前沿多模态 AI 能力直接嵌入机器人物理交互闭环的模型家族。语言模型产生幻觉,结果是一段不准确的回答;机器人产生幻觉,结果是物理后果。本文深入分析三模型家族的技术架构、与 NVIDIA GR00T 和 Physical I
"Google DeepMind 的 Gemini Robotics 是首个能看见、推理并物理交互真实世界的 AI 模型家族。它如何工作,基准测试表现如何,以及与 Boston Dynamics 的合作为什么意味着新时代的开始。"