行业新闻

当前位置：首页 > 新闻中心 > 行业新闻

利用量子技术，机器人学习速度更快

日期：2021-04-28

奥地利维也纳大学，因斯布鲁克大学，德国量子技术研究所，以及荷兰莱顿大学的研究人员首次成功证明了量子技术可以加速机器人学习过程。相关研究发表在《Nature》上。

人工智能是我们现代生活的一部分。实际应用中的一个关键问题是这种智能机器的学习速度有多快。这里，研究人员通过实验已经回答了这个问题，通过将用于单光子的量子处理器用作机器人表明了量子技术可以加快学习过程。

解决计算机游戏，识别人的声音或帮助寻找最佳治疗方法的机器人：这些是过去几年人工智能领域产生的惊人例子。不断寻求更好的机器的竞争引发了一个问题，即如何以及以何种方式实现改进。与此同时，最近量子技术的巨大进步证实了量子物理学的威力，不仅因为它常常是奇特而令人费解的理论，而且也因为它在现实生活中的应用。因此，融合这两个领域的想法：一方面，人工智能及其自主机器；另一方面，量子物理及其强大的算法。

在过去的几年里，许多科学家已经开始研究如何连接这两个世界，并研究量子力学如何证明有利于学习机器人，反之亦然。一些有趣的结果表明，例如，机器人决定他们的下一步行动更快，或设计新的量子实验使用特定的学习技术。然而，机器人仍然无法更快地学习，这是日益复杂的自主机器发展的一个关键特征。

人工智能中的一个重要范例是强化学习（RL），即被称为“代理”的决策实体与环境交互，并通过在获得反馈的基础上更新其行为进行学习。只要代理执行良好（即做出正确的决定），环境就会奖励其行为，并且代理会使用此信息来逐步增加完成其任务的可能性。实际应用中的关键问题是代理的学习速度。尽管各种研究已经利用量子力学来加快代理的决策过程，但尚未证明学习时间的减少。

图1，学习代理的示意图。a, 代理通过接收感知输入si并输出动作ai与环境进行交互。b，代理和环境进行经典交互，即使用经典信道，其中只能通过固定的首选基础（例如，垂直或水平光子极化）进行通信。 c，代理和环境通过量子通道进行交互，在该通道上交换任意叠加状态。

这里，研究人员提出一种强化学习实验，这是环境和一种量子增强的混合代理之间的交互。使用该混合代理可以通过交换量子状态，这意味着通信不再局限于经典信道（具有固定的首选基础），而是允许通过量子信道进行任意叠加的交换。这样可以在其学习时间中实现量子加速，并实现对学习过程的最佳控制。

简而言之，可以通过想象一个站在十字路口的机器人来理解实验，该机器人的任务是学习始终向左转。机器人在执行正确的动作时会通过获得奖励来进行学习。现在，如果将机器人放置在我们通常的经典环境中，那么它将尝试左转或右转，并且只有在选择了左转的情况下才能获得奖励。相比之下，当机器人利用量子技术时，量子物理学的奇异面开始发挥作用。机器人现在可以利用其最著名，最独特的功能之一，即所谓的叠加原理。直观理解的话，通过想象机器人同时向左转和向右转，研究人员Hans Briegel表示：“这一关键功能使得量子搜索算法的实现能够减少学习正确路径的尝试次数。因此，一个能够在叠加中探索其环境的智能体，这将比传统的智能体学习得快得多。”

为了进行验证，研究人员利用了单光子，即光的基本粒子，并将其耦合到由麻省理工学院设计的紧凑且完全可调的集成纳米光子处理器上实施此学习协议。该处理器用于机器人并用于执行学习任务。该设备与电信波长光子对接，具有快速的有源反馈机制，将可以轻松集成到未来大规模量子通信网络中，进而展示代理的系统量子优势。

通过使用量子计算可以增强机器学习的这一实验性的演示显示了将这两种技术结合在一起时的有希望的优势。菲利普·沃尔瑟（Philip Walther）说，“这是初次开始了解量子人工智能的可能性，因此，每一项新的实验结果都为该领域的发展做出了贡献，而该领域目前被视为量子计算领域中最富饶的领域之一。 ”

新闻链接原文链接