谷歌 DeepMind 放大招：新 AI 模型赋能机器人 “自学成才”

时间：2025-03-14 14:05:21

　　3 月 12 日晚间，谷歌 DeepMind 在机器人 AI 领域扔下 “重磅炸弹”，一口气推出两款新型 AI 模型，为机器人在现实世界中的应用带来了全新突破。

　　先来说说 Gemini Robotics，这是一款视觉语言行动模型，它的厉害之处在于，能让机器人在没有经过专门训练的情况下，迅速理解并适应全新的场景。Gemini Robotics 是基于谷歌的旗舰 AI 模型 Gemini 2.0 开发的，就像是给 Gemini 2.0 装上了 “现实行动” 的翅膀。

　　谷歌 DeepMind 机器人部门的高级总监 Carolina Parada 介绍，Gemini Robotics 借助 Gemini 2.0 强大的多模态理解能力，融入物理行动这一新模态，成功打通了 AI 与现实世界交互的通道。在通用性、互动性和灵活性这三个机器人高效运作的关键领域，Gemini Robotics 都取得了显著进展。它不仅能应对各种新情况，在与人类和周围环境互动时表现得更加出色，还能完成像折纸、开瓶盖这类精细的物理操作。

　　另一款 Gemini Robotics - ER（具象推理）模型也不容小觑，它被视为一种先进的视觉语言模型，具备 “理解复杂动态世界” 的能力。Parada 举例说，当我们准备装便当盒时，需要考虑桌上物品的摆放位置和操作方式，而 Gemini Robotics - ER 就是为解决这类推理任务而设计的。机器人专家可以通过它与现有的低级控制系统对接，为机器人解锁更多新功能。

上一篇：OPPO Find X8S曝光：将搭载联发科最强芯片返回首页

下一篇：中华电信MWC 2025：深化AI与6G布局，卫星服务进展显著

热点推荐

1 印度执法局突袭班加罗尔公司，涉嫌加密

消息，印度执法局近日对班加罗尔的几家公司进行了突袭，原因是涉嫌进行超过2.6亿美元的加...

2 伊朗外交部：美国未能约束以色列，违反

消息，伊朗外交部发言人巴加埃当地时间20日表示，谅解备忘录的第一条，即结束所有战线的战...

3 PeckShield：PancakeSwap上的OLPCLabubu池被攻击，

PancakeSwap上的OLPC/Labubu池遭到攻击，导致约110万美元的损失。攻击者将被盗资金跨链转移，并存...

4 美国参议院磋商CLARITY法案，拟明确非托管

美国参议员正加紧谈判推动CLARITY法案在国会休会后进入参议院全体表决流程。两党参议员本周...

5 日本大阪警方逮捕3名利用稳定币洗钱的场