谷歌公司近日发布了一款名为Robotics Transformer 2(RT-2)的全新机器人模型。这款机器人采用了最新版本的大语言模型,赋予了它们更强大的视觉-语言-行动能力。据谷歌透露,RT-2可以通过接收网络上的信息和图像,训练机器人执行各种任务,例如扔垃圾等。与以往机器人需要明确训练识别垃圾并学会动作的方式相比,RT-2可以从大量网络数据中获取知识,无需明确训练即可识别垃圾,并执行相关动作。
这一新技术使得机器人的性能有了质的飞跃,准确率从以前的仅有32%提升至令人惊喜的62%。Vincent Vanhoucke,谷歌DeepMind的机器人主管表示,由于生成式AI的飞速发展,谷歌不得不重新思考整个研究计划,以适应新的技术趋势。他认为之前采用的许多传统方法在这种新技术面前已经显得不够高效,而RT-2的发布则代表了一种重要的突破。
虽然目前机器人的灵活程度和执行复杂任务的能力仍不及人类,但谷歌通过将人工智能语言模型与机器人结合,为机器人赋予了新的推理和即兴创作技能,这被认为是一个有希望的进步。该技术为未来机器人发展开辟了更加广阔的前景。
值得一提的是,虽然RT-2机器人展现了令人瞩目的进步,但在机器人领域仍面临着众多挑战。人们普遍认为,要使机器人能够在更多领域展现出与人类更接近的智能水平,还需进行更多的研究和技术创新。