开“天眼”了!谷歌将Gemini 1.5 Pro安装到机器人上 实现记忆导航能力
在科技的江湖里,Google DeepMind又扔出了一个重磅炸弹——他们把一个叫Gemini1.5Pro的系统装到了机器人身上。这可不是普通的升级,这玩意儿让机器人有了记忆导航的超能力,简直就是给机器人开了个“天眼”。
想象一下,这个机器人在将近9000平方英尺的地盘上,能执行57种不同的任务,而且成功率达到了90%。这不是简单的任务,比如找到画画的地方,机器人不仅听懂了,还带你找到了一块大白板。这操作,简直比真人还靠谱。
这个系统的厉害之处在于,它能够处理多模态的长上下文窗口,这意味着机器人不仅能记住关键位置,还能理解人类的指令、视频导览,甚至用常识来推理。就像那个Google员工的例子,机器人不仅听懂了“画画的地方”,还知道要找个有大白板的地方。
而且,这些机器人在之前的项目中已经熟悉了办公室环境,它们通过“多模态指令导航演示”了解了空间布局。DeepMind的团队还用了一种分层视觉-语言-动作(VLA)技术,让机器人能够理解书面、绘图命令和手势指令。
这个系统的核心,是它能够让机器人在复杂的空间中自由行动,而且不需要人类时时刻刻的指导。它们能够记住环境,理解指令,然后用自己的方式来完成任务。这种能力,让机器人在实际应用中变得更加灵活和有用。
总之,Google DeepMind的这项技术,不仅仅是让机器人变得更聪明,更是让它们能够在真实世界中更好地服务于人类。这就像是给机器人打开了一扇新的大门,让它们能够走进我们的生活,成为我们工作和探索世界的伙伴。未来的机器人,或许就不再是冷冰冰的机器,而是我们生活中的智能伙伴。