当前位置:主页 > 推荐 >

谷歌DeepMind发布Gemini RoboticsER 1.6,Spot机器人已能自动读仪表盘

时间:2026-04-15 03:23:30

  消息,4 月 14 日,谷歌 DeepMind 发布 Gemini Robotics-ER 1.6,定位为机器人的高层推理模型,相比前代 ER 1.5 和 Gemini 3.0 Flash 在空间推理和多视角理解上有显著提升。模型已通过 Gemini API 和 Google AI Studio 向开发者开放。 核心升级包括三项能力: 1. 指向精度提升:可用于精确物体检测、计数、空间关系推理和运动轨迹规划,且能正确拒绝指向画面中不存在的物体 2. 多视角成功检测:机器人现在能综合多个摄像头画面判断任务是否完成,即使在遮挡或动态环境下也能保持准确 3. 新增仪表读取能力:可解读圆形压力表、垂直液位指示器和数字显示屏等多种工业仪表,通过 agentic vision实现逐步推理,先放大细节区域,再通过指向和代码计算比例与间隔,最后结合世界知识得出读数 仪表读取能力源于 DeepMind 与 Boston Dynamics 的合作。Boston Dynamics 同日宣布,已将 Gemini 和 Gemini Robotics-ER 1.6 集成到其 Orbit AIVI-Learning 产品中,于 4 月 8 日对所有 AIVI-Learning 客户上线。集成后新增了仪表盘支持,四足机器人 Spot 现在可以在工业设施中自主巡检并读取压力表等仪表数据。Boston Dynamics 称,借助 Gemini 的推理能力,AIVI-Learning 在既有的视觉巡检、托盘计数、积液检测等任务上的基线性能和准确率也有所提升。 DeepMind 称 ER 1.6 是其「最安全的机器人模型」。在对抗性空间推理任务中,安全指令遵从度大幅优于 ER 1.5。在基于真实受伤报告的安全风险识别测试中,ER 系列模型较 Gemini 3.0 Flash 在文本场景上高 6%,视频场景上高 10%。

热点推荐
1 LMAX推出Kiosk平台,支持加密资产作为外汇

消息,LMAX集团推出Kiosk,这是一个托管门户,允许机构客户将数字资产存入LMAX保管,并在多个...

2 麻吉黄立成:BTC多单增持23枚,当前盈亏

消息,麻吉黄立成在HyperLiquid平台增持BTC多单23.00枚,约合1,891,554.00美元。当前持仓规模为9,0...

3 日本20年期国债收益率升至1997年高位

消息,受通胀担忧影响,日本20年期国债收益率升至1997年以来的最高水平,触及3.495%。该收益...

4 以太坊ETF净流出达1.31亿美元

消息,5月12日,以太坊ETF净流出总额达到1.31亿美元。其中,黑石的$ETHA净流出1.0205亿美元,富...

5 多个Telegram用户名在Fragment平台以天价成交

近期多个Telegram用户名及匿名号码在Fragment平台上以天价成交。其中,用户名danbao以158万TON成交...

6 莫斯科法院判决前Binance主管因诈骗获刑五

莫斯科普列斯内斯基区法院对前Binance俄罗斯及独联体区主管、Blum联合创始人Vladimir Smerkis作出...

7 马斯克要求控制权「世袭」:Altman曝光当

消息,OpenAI首席执行官Sam Altman周二在联邦法庭首次出庭作证,曝光了2018年Elon Musk退出OpenAI核心...

8 Elliptic完成1.2亿美元融资,估值达6.7亿美

消息,Elliptic宣布完成1.2亿美元的D轮融资,估值达到6.7亿美元,此轮融资获得德意志银行和纳...

9 以太坊基金会推出清晰签名标准,提升安

消息,以太坊基金会推出了一项名为清晰签名的新标准,该标准用可读的交易替代了盲签名,...

10 美元指数12日上涨至98.298

消息,美元指数在12日上涨0.35%,在汇市尾市收于98.298。截至纽约汇市尾市,1欧元兑换1.1741美元...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。