如何玩魔方_OpenAI机器人玩魔方最新成果,这次和以往的不一样

如何玩魔方

1。人工智能玩魔方一年前

一年多前,总部位于旧金山的盈利性人工智能研究实验室OpenAI宣布,他们已经训练机器人手以惊人的灵活性操作魔方

可能听起来平淡无奇但是在人工智能世界里,有两个令人印象深刻的原因首先,这只机械手学会了如何使用强化学习算法来控制魔方,这是一种模仿动物学习方式的技术。第二,所有的训练都是在模拟中完成的,但它被成功地转化并应用于现实世界。这两种方法都是更敏捷的机器人面对工业和消费应用的重要步骤。

如何玩魔方

2。一手解决魔方问题,一个质的飞跃!

在一篇论文中,OpenAI发布了其机器人手Dactyl的最新结果。这一次,戴克泰学会了用一只手解决魔方问题。这一次,仍然使用强化学习算法在模拟环境中完成。机器人解决魔方问题可能没有什么新东西,但值得注意的是,这个实验将机器人的灵活性提高到了一个新的水平。密歇根大学专门研究机器操作的机器人专家德米特里·贝伦森说:“这是一个非常困难的问题。旋转魔方部件所需的操作实际上比旋转魔方要困难得多。”"

如何玩魔方

3。从虚拟世界到物理世界传统上,机器人只能以非常简单的方式操纵物体尽管强化学习算法在完成软件中的复杂任务方面取得了巨大成功,但用它们来训练物理机器却是另一回事。这是因为科学家必须通过数百万次测试反复验证和纠正错误,以完善算法本身。在许多情况下,在现实世界中进行这样的测试操作可能需要很长时间,而对于机器人来说,将会有不同程度的机械磨损。如果机器人被用来不受约束地收集数据,甚至会发生危险。

为了避免这种情况,机器人专家提出了一种模拟状态,他们建立了机器人的虚拟模型,并对它进行虚拟训练,使它用机器人的手来完成任务在数字空间安全的情况下,该算法可以实现安全操作,并且可以移植到未来的物理机器人上。然而,这一过程有其自身的挑战。建立一个虚拟模型来完全复制现实世界中所有相同的物理规律、材料特性和操纵行为几乎是不可能和不现实的,更不用说各种可能的事故了。因此,机器人及其面临的任务越复杂,模拟训练的算法过程在物理世界中就越困难。

如何玩魔方

4。疯狂布置模拟测试

这次成功的关键是实验室在每一轮训练中以各种疯狂的方式打乱了模拟条件,不仅改变了重力的大小,还改变了重力指向的方向...以便使算法更适合各种可能性。这样,通过尝试建立一个能够可靠地模拟所有疯狂排列的策略,该算法实际上最终可以在真实的机器人中运行。“

5。机器人为自己增加训练难度

在最新的论文中,OpenAI进一步发展了这项技术以前,研究人员必须手动选择环境中的参数。现在,训练系统可以自己完成这项任务每当机器人在现有环境中达到一定的掌握水平时,模拟器就会调整自己的参数,使训练条件更加困难。作为

的结果,该算法更加实用,并且能够以现实生活中旋转魔方所需的精度移动。通过测试,研究人员发现,在各种未经训练的条件下,戴克泰也能成功解决魔方。例如,当机器人戴着橡胶手套,把几个手指绑在一起,或者受到外部物体的干扰时,它可以成功地完成任务。

如何玩魔方

6。万能机器人,快到了?

OpenAI相信最新的结果提供了强有力的证据,证明他们的方法将会释放出更多的通用机器人,能够适应开放的环境,比如家庭厨房。OpenAI的研究人员说:“魔方是最复杂的刚性物体之一”“我不认为其他物体要复杂得多“

,但是,也有一些研究者对此表示怀疑贝伦森认为,“可能有一个统一的理论或系统的印象。现在OpenAI只将它应用于一个单独的任务。即使有共同的组成部分,仍然有许多项目可以使每个新任务正常工作。””“这就是我不理解这种“万能机器人”的原因。我认为这是一个针对特定应用的非常特殊的系统。"

如何玩魔方

7。突破强化学习需要一些时间。部分问题在于加强学习本身。从本质上来说,这项技术旨在掌握一件事情,并有一定的灵活性来应对其中的变化。然而,在现实世界中,潜在变化的数量超出了可以合理模拟的范围。例如,在清洁任务中,可能会有不同种类的拖把、不同种类的垃圾溢出和不同种类的地板。强化学习也旨在从头开始学习新的函数这对机器人来说是低效的,也不符合人类的学习方法。“如果你已经是一个非常有能力的人,我试着在厨房教你一些技能,比如,你可能永远不会用勺子搅拌东西,那么你就不需要重新学习整个运动控制,”凯尔布林说。

贝伦森认为,需要其他更传统的机器人技术来克服这些限制。他说:“最终会有一些学习过程,也许是强化学习。”“但我认为实现这些突破可能需要一些时间。”“

大家都在看

相关专题