Google DeepMind 的 Gemini Robotics 是第一个将前沿多模态 AI 能力直接嵌入机器人物理交互闭环的模型家族。语言模型产生幻觉,结果是一段不准确的回答;机器人产生幻觉,结果是物理后果。本文深入分析三模型家族的技术架构、与 NVIDIA GR00T 和 Physical I
Google DeepMind's Gemini Robotics represents the first credible attempt to bring frontier multimodal AI capabilities directly into the physical world.