1. 首页
  2. 资讯
  3. 谷歌DeepMind发布Gemini Robotics-ER 1.6,聚焦于“具身推理”

谷歌DeepMind发布Gemini Robotics-ER 1.6,聚焦于“具身推理”

第一电动永娟
4月15日消息,谷歌DeepMind正式推出Gemini Robotics-ER 1.6,这是其专为物理环境中自主机器人设计的具身推理AI模型的重大升级。新模型聚焦于“具身推理”,使机器人能够解读视觉输入、规划任务并判断任务是否完成,标志着机器人从指令跟随型系统向具备上下文感知决策能力的系统转变。谷歌DeepMind将其描述为“迄今为止最安全的机器人模型”。
Gemini Robotics-ER 1.6作为机器人的高级决策枢纽,不直接操控机械动作,而是负责任务规划、工具调用和成功检测。它可原生调用谷歌搜索、视觉-语言-动作模型或第三方用户定义函数,使机器人能够“看到、理解并反应于真实世界的挑战”。DeepMind首席执行官Demis Hassabis表示,此次升级是从感知到行动闭环的重要进展,让机器人更好地推理物理世界并在真实场景中发挥作用。在空间与物理推理基准测试中,新模型全面超越了前代ER 1.5和Gemini 3.0 Flash。
新模型最具突破性的能力是自主读取工业仪表。通过结合视觉推理与代码执行,机器人可缩放图像、识别指针与刻度标记,并以极高精度计算数值。在代理式视觉加持下,仪表读取准确率从此前模型的23%跃升至高达93%。该模型还能自动编写代码校正相机畸变(如广角镜头的桶状或枕状效应),以亚毫米精度计算刻度标记,无需大量人工重新编程即可适配不同相机设置,显著降低了工业巡检的扩展门槛。这一功能特别适用于制造业、石油天然气、炼油厂和能源设施等仍大量使用传统模拟仪表的高风险环境,为存量工厂提供了可即刻部署的自主化升级路径。
安全是Gemini Robotics-ER 1.6的核心支柱。新模型能够理解执行指令时的物理约束,明确避开液体、重量超过20公斤的物体等不安全物品。同时,模型在视频中检测人类受伤风险的能力较前代提升10%。这些安全特性强化了机器人规划与感知的安全边界,为仓储物流、医疗辅助等场景带来更高合规性与更低事故率的落地机会,潜在保险成本可降低约15%。据国际劳工组织数据,每年全球有超过3.4亿起职业伤害,此类AI技术的应用预计可在自动化环境中减少10%至15%的事故发生率。

来源:一电快讯

返回第一电动网首页 >

7点赞
发表评论
热文榜
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!