Google DeepMind 发布 Gemini Robotics-ER 1.6,具身智能新模型

2026-04-19 16:02:30

Google DeepMind 推出了新的基座机器人 AI 模型 Gemini Robotics-ER 1.6,专为精确的空间推理设计。增强了空间推理和多视角理解能力,为物理代理和机器人带来更高自主性。模型提供高层推理能力,包括任务规划和工具调用。改进包括精确物体检测、分类和识别能力,适用于分拣包裹或整理房间等任务。支持关系逻辑推理,如比较物体大小、定义物体移动路径。提升了仪表读数能力,机器人可以读取仪表盘和仪器,需要复杂的视觉推理能力,如指针、刻度和数字读取。这是 DeepMind 最安全的机器人模型,在对抗性空间推理任务中显示更高合规性,在物理安全约束下更遵守。通过 Agent Vision 实现高精度:结合视觉推理和代码执行,模型拍照解析细节,估计比例和间距,然后用推理引擎解读。开发者可以通过 Gemini API 和 Google AI Studio 访问。

该模型与 Boston Dynamics 合作开发,特别优化了工业设施巡检场景,使 Spot 机器人能够自主看懂仪表盘、压力表等设备,实现零停机升级。