TR35 | Sergey Levine:提高机器人任务能力的关键,就是让它成为“自学小能手” | 新智造

TR35 | Sergey Levine:提高机器人任务能力的关键,就是让它成为“自学小能手” | 新智造

美国时间8月23日,《麻省理工科技评论》公布了第16届TR35榜单,即全球35名35岁以下青年创新者榜单。各路精英在创造力、毅力、管理能力方面都堪称翘楚,他们的创新领域涉及医疗、能源、计算机和先进电子器件;他们的事业舞台涵盖初创公司、研发机构和企业巨头。他们是各自领域的领军人物。而加州大学伯克利分校机器人学专家Sergey Levine便是其中的一员。

在今年三月的围棋人机大战中,谷歌人工智能AlphaGO打败了世界最优秀的围棋选手李世石,让人们深深感叹当今人工智能的强大力量。当时,Sergey Levine正在谷歌公司工作。在这九个月的工作时间中,他亲眼目睹了人工智能的胜利,在钦佩AlphaGo在机器学习领域所取得的成就的同时,他发现了这个强大的围棋游戏算法中存在的一个明显缺点。

他笑称:

纵使它们(程序)能够战胜世界最棒的围棋选手,但它们从未亲自拿起过一枚棋子。

众所周知,机器人有着强大的大脑,它们足够聪明,运算速度超快,能够完成人类无法完成的工作。然而,它们也存在一个劣势:一些在人类看来最常见最简单的动作(比如擦桌子、抓杯子等),它们做起来非常困难。因此,它们要顺利地完成这些任务,学习能力相当重要。

而Sergey Levine在做的,就是教会机器人学习。

让机器人吸取经验、自学成才

在谷歌研究所中,14只机器人手臂摆在一起,连续数月地捡起不同的物品,重的、轻的、扁的、大的、小的、硬的、软的、还有半透明的。而这正是Sergey Levine团队正在进行的项目。

TR35 | Sergey Levine:提高机器人任务能力的关键,就是让它成为“自学小能手” | 新智造

日复一日地捡起物品听起来有点蠢,但Sergey Levine觉得这种方法独一无二、意义重大。要教会机器人完成一个动作,传统的方法首先要让机器人去识别、分辨不同的物体,然后要通过反复的训练,最终才能实现目标。这种方法在教会机器人完成简单的任务(比如拧上瓶盖)时还算凑效,但这个训练过程漫长而无味。另外,在面对复杂的任务时,这种方法的效果并不明显。

而Sergey Levine团队的方法却与传统方法截然不同,它的关键之处在于将已经十分出众的图像识别分类算法用于机械臂,让机器人能从先前的成功经验中学习。

首先,Levine给机械臂设定一些手头上很容易解决的目标(比如拧上瓶盖),完成之后机械臂就可以回顾之前的成功案例,并从中学习经验,方便完成今后的任务。同时,机器人会观测视觉系统数据如何映射到机械臂的电机信号,从而正确地完成任务。此外,机器人还会监督自己的学习过程。

而之所以要让这14只机械臂日复一日地捡起不同的物品,就是为了让它们能够学习不同物品的不同经验,从而将经验用到其他的物品之上。Levine表示:

这是对机器自身行为的逆向工程。这样,它就可以将学习到的知识应用到随后的相关任务中,这样机器人就会越来越聪明。

TR35 | Sergey Levine:提高机器人任务能力的关键,就是让它成为“自学小能手” | 新智造

用卷积神经网络“调教”机器人

其实,要教会机器人捡起不同的物体非常复杂,因为传感器数据和实际行动之间没有明显的必然联系,尤其是当大量传感器数据一下子涌来时。

为了克服这一点,Sergey Levine团队让机械臂杂乱地使用单目视觉伺服、深度卷积神经网络来捡起目标物(如杯子、胶带座和玩具海豚),从而预测抓取的结果。机器人的度卷积神经网络会不断进行自我再训练(起初有许多次失败,但渐渐会开始好转)。最开始,团队所运用的机械臂并没有那么多,后来为了加快这一进程,团队并行投入了 14 只机械臂来研究这一问题。这一系列过程是完全自主的,人类所需要做的就是把箱子填满然后打开电源等着机器人主动完成任务即可。

经过一年训练后,手臂能够自己抓取并捡起小物体。但是,机械臂的编程信息通常是用来识别物体并按照预定的程序做出反应,无法像人类一样根据周围的环境做出改变。那么问题就来了:对于可预测的物体和环境,机械臂可以轻松应对,但是它们可以抓取从来没有见过的物体吗?

为了探究这一点,Sergey Levine让机器人手臂伸入随机装满物体的盒子里,让它们凭藉运气随机抓取物体。在一天之后,他收集机器人尝试抓取物体的数据,然后用这些数据训练神经网络,让抓取物体的结果更加理想。在80 万次(相当于 3000 小时的机器人训练)抓取行动之后,机械臂就可以自动纠正自己的行动了。很快,他们就可以更加顺利地抓取物体了,甚至会采用某种策略,如推开一个物体去抓取另外一个物体,或者去抓取柔软的物体而不是坚硬的物体等。

TR35 | Sergey Levine:提高机器人任务能力的关键,就是让它成为“自学小能手” | 新智造

在机械臂完成所有这些任务的过程中,没有程序员编写系统告诉他们该怎么抓取物体,但它们可以从自己的经验中学习。此外,它们还能使用反馈环路,将抓取物体的失败率降低到18%。

现在,Sergey Levine研究的机器人已经练成了“抓物神功”,不过,要想从实验室走到真实世界,并能轻松应对变化多端的环境、不同的目标物、不同的光照条件及不同程度的磨损,这些机械臂还需要很长一段时间的“调教期”。

目前,Sergey Levine打算将他们的研究扩展到更宽的领域中,然后在实验室之外的其他多种真实环境中进行尝试。我们期待这些机器人能够“学有所成“,成为更加聪明、更有“灵魂”的机器人。

新智造为雷锋网(公众号:雷锋网)旗下专注于机器人的公众号,我们关注机器人的现状与未来,以及与机器人结合的相关产业。感兴趣的朋友可添加微信号AIRobotics,或是直接扫描下方二维码进行关注!


TR35 | Sergey Levine:提高机器人任务能力的关键,就是让它成为“自学小能手” | 新智造

雷锋网原创文章,未经授权禁止转载。详情见转载须知

TR35 | Sergey Levine:提高机器人任务能力的关键,就是让它成为“自学小能手” | 新智造

(完)