DeepMind的新人工智能可以在没有特定训练的情况下控制机器人任务

DeepMind的新人工智能可以控制机器人任务

Google DeepMind推出了一种新的AI模型，可以指导从未训练过的机器人任务。

该模型名为RT-2，它从网络和机器人数据中学习，并将这些信息转化为机器的简单指令。

在测试中，该模型被要求执行机器人数据中从未见过的动作，例如将橙子放入匹配的碗中。为了遵循这些指令，系统需要将来自基于网络的数据的知识进行翻译。根据DeepMind的说法，该模型在这些操作中成功率达到62%，是其前身RT-1的两倍。

DeepMind的机器人主管Vincent Vanhoucke说：“就像语言模型通过从网络中学习文本来了解一般的思想和概念一样，RT-2通过从网络数据中获取知识来指导机器人行为。换句话说，RT-2能够与机器人交流。”

测试表明，RT-2具有令人印象深刻的泛化能力。它还对以前未曾遇到的机器人数据具有改进的语义和视觉理解能力。

值得注意的是，该模型可以使用基础推理来遵循新的用户命令。令人印象深刻的是，它甚至可以进行多阶段的语义推理。例如，当被指示选择一个可以用作锤子的物体时，RT-2正确地选择了一块石头。

在另一个评估中，该模型被命令将一瓶番茄酱推向一个蓝色的立方体。

场景中有几个物体，但训练数据集中只有立方体。尽管如此，RT-2成功地将番茄酱推向指定的目的地。

DeepMind将RT-2视为人工智能领域的重大突破。这家伦敦实验室表示，该模型使我们更接近一个有用的机器人的未来。

Vanhoucke说：“RT-2不仅展示了人工智能在机器人领域的快速发展，还为更通用的机器人提供了巨大的潜力。虽然在人类中心的环境中实现有用的机器人仍然需要大量的工作，但RT-2向我们展示了一个令人兴奋的机器人未来就在眼前。”

您可以在此处阅读RT-2的研究论文。