三阶魔方的玩法口诀_OpenAI 机械手“学习”解开三阶魔方技术

中关村在线新闻:根据国外媒体最近的报道,OpenAI是一家以研究人工智能和机器学习而闻名的公司。周二展示了一个能够解决三阶魔方的机器人。

三阶魔方的玩法口诀

三阶魔方的玩法口诀

开放式人工智能操作器“学习”求解三阶魔方

手指操作器是通过使用一种称为自动领域随机化(ADR)和强化学习的新技术来训练的在过去的Dota 2中,Dactyl采用的强化学习算法已经证明它可以抵抗人类对手。

新技术ADR通过生成越来越困难的Dactyl训练场景,帮助教导操作者解决古老的问题。自动领域随机化方法如下:

ADR从单个非随机环境开始,其中神经网络学习如何求解三阶魔方随着神经网络在任务中变得更好并达到性能阈值,领域随机化的数量将自动增加

这使得任务更加困难,因为神经网络现在必须学会将它们扩展到更随机的环境。神经网络继续学习,直到再次超过性能阈值,然后执行更多随机化,然后重复该过程

团队认为ADR是一个显著的改进,因为逐渐困难的训练模拟的建立“将我们从真实世界的精确模型的束缚中解放出来,并且使得在模拟中学习到的神经网络的转移能够应用到真实世界中。”“

最后,在使神经网络适应各种情况后,Dactyl能够熟练地适应各种物理情况,包括手指被绑住、戴橡胶手套等

(本文中的图片来自互联网)

大家都在看

相关专题