机器人近年发展_AI发展热点透视:《2019人工智能发展报告》出炉

机器人近年发展

最近,清华大学-中国工程院知识智能联合研究中心、中国人工智能学会吴文俊人工智能科学技术奖评选基地联合发布了《2019人工智能发展报告》,选定了深度学习、计算机视觉、语音识别、机器人等前沿技术的基础和应用研究、发展动向等13个人工智能重点领域。

深度学习突破图像、语音等知觉类问题

机器学习是一门多学科交叉学科,研究计算机如何模拟和实现人的学习行为,获得新的知识和技能。

1950年,阿兰·图灵做了判定电脑是否智能的图灵测试。 图灵测试认为,如果机器与人类对话,不能辨别机器的身份的话,那台机器是有智能的。 这种简化使图灵能够接受“思维机器”。

之后,由IBM科学家阿瑟·塞缪尔开发的检查程序,普罗维登提出的机器不得超越人的论断,像人一样编写代码和学习模式,他创造了“机器学习”这个术语。

但是,从20世纪60年代中期到70年代末期,机器学习的发展步伐几乎停滞不前。 无论是理论研究还是计算机硬件限制,人工智能领域整体的发展都遇到了很大的瓶颈,神经网络学习机由于理论缺陷也未能达到预期的效果而陷入低潮。 直到WebBS在神经网络反向传播( BP )算法中具体提出多层感知器模型为止,机器学习被重新启动,并且迄今为止BP算法都是神经网络结构的重要部分。

神经网络研究者相继提出运用BP算法训练的多参数线性规划理念,为后来深入学习奠定了基础。 在另一个系统中,昆兰提出了非常着名的机器学习算法,特别是ID3算法,该算法至今仍然活跃在机器学习领域。

机器学习迎来爆发期的是神经网络研究领域的领导人Hinton于2006年提出了神经网络Deep Learning算法,大大提高了神经网络的能力。 Hinton和他的学生Salakhutdinov在《科学》发表文章,在学术界和工业界掀起了深刻的学习浪潮。

2015年,为纪念人工智能概念提出60周年,LeCun、Bengio和Hinton发表了深入学习的共同综述。 深度学习能够使具有多个处理层的计算模型学习多层抽象数据的表示,这些方法在很多方面都带来了显着的改进。 深入学习的出现,真正突破了图像、声音等知觉类问题,推进了接近实际应用的人工智能的新时代。

计算机视觉产生人脸识别、智能视频监控等应用

所谓计算机视觉,顾名思义,是一门以智能方式使计算机像人眼一样“看到”的研究科学,对客观存在的三维立体世界的理解和认识是通过智能的计算机来实现的。

计算机视觉技术使得利用摄像机和计算机来代替人眼,使计算机具有人眼所具有的分割、分类、识别、跟踪、判别、决策等功能。

马尔( David Marr )“视觉”这本书的出现,表明电脑的视觉成为了独立的学科。 在计算机视觉的40多年发展中,提出了许多理论和方法,总体来说,计算机视觉经历了三个主要的历史:马尔计算视觉、多视觉几何和分层三维重建和基于学习的视觉。

目前,通过提升计算机“深度网络”来提高物体识别的精度似乎等于从事“视觉研究”。 马尔的计算视觉分为计算理论、表示和算法与算法的实现三个层次。 马尔认为算法的实现不会影响算法的功能和效果,因此马尔计算视觉理论主要讨论“计算理论”和“表达和算法”两个内容。

马尔认为大脑的神经计算和计算机的数值计算没有本质的区别,马尔对“算法实现”没有任何研究。 从目前神经科学的进展来看,“神经计算”和数值计算可能会产生与目前兴起的神经形态计算相似的本质差异,但总体上,“数值计算”可以是“模拟神经计算”。 至少从目前来看,“算法的不同实现途径”不影响马尔计算视觉理论的本质属性。

20世纪90年代初,计算机视觉从“萧条”走向“繁荣”,主要是目标应用领域从精度和鲁棒性要求高的“工业应用”要求不大,特别是只需要“视觉效果”的应用领域,如远程视频会议、考古、虚拟现实、视频监控等两个要素。 而多视几何理论的分层三维重建具有提高三维重建鲁棒性和精度的效果。

多视几何的代表人物是法国INRIA的O.FauGEras,美国ge研究院的R.Hartely和英国牛津大学的A.Zisserman。 2000年Hartely和Zisserman合作的书对这方面的内容进行了比较系统的总结。 大型数据需要完全自动重建,完全自动重建需要重复优化,重复优化需要大量计算资源。 举个简单的例子,如果要三维重建北京中关村地区,为了保证重建的完整性,需要获取大量的地面和无人机图像。 如果获取1万张地面高分辨率图像( 4000×3000 )、5千张高分辨率无人机图像( 8000×7000 ),则三维重建将与这些图像匹配,从中选择适当的图像集,确定摄像机位置信息,重建场景的三维结构,这样大的数据量不能人工涉及

基于学习的视觉是以机器学习为主要技术手段的计算机视觉研究。 基于学习的视觉研究,文献大致有两个阶段:以21世纪初流形学习为代表的子空间法和以当前深度学习为代表的视觉方法。

近年来,大量数据的出现和计算能力的迅速提高给以非结构化视觉数据为研究对象的计算机视觉带来了巨大的发展机遇和挑战性课题,计算机视觉也成为学术界和工业界公认的前瞻性研究领域,一些研究成果已经得到实用化,产生了面部识别、智能视频监控等诸多显示度非常高的商业应用。

语音识别应用于工业、通信、医疗等行业

语音识别是使机器识别并理解说话者的语音信号的内容的新兴学科,以将语音信号转换为文本字符或命令的智能技术为目的,利用计算机理解说话者的意思内容,理解人的语音,判断说话者的意图,是非常自然有效的人机交流方式。

语音识别的研究可以追溯到1950年代。 1952年,AT&; t贝尔研究所研究了世界上第一个语音识别系统Audry系统,能识别10个英语数字发音。 该系统认识到一个人说话的孤立数字,很大程度上依赖于各数字母音的共振峰的测量。

计算机的应用推动了语音识别技术的发展,提出了一套语音识别技术的新理论——动态规划线性预测分析技术,很好地解决了语音信号模型问题。 20世纪70年代,语音识别研究取得了重大的成果,随着自然语言理解的研究和微电子技术的发展,语音识别领域取得了突破性的进展。 此时语音识别方法基本采用传统模式识别策略。

此后,语音识别研究进一步深入。 在这一时期取得的重大进展,隐马尔可夫模型( HMM )技术的成熟和完善,以及最终成为语音识别主流的方法——基于知识的语音识别研究越来越受到重视。 连续语音识别不仅利用声学信息,更多地利用结构词、句法、语义、对话背景等语言知识,帮助语音识别和理解。 同时,在语音识别研究领域,也产生了基于统计概率的语言模型的人工神经网络在语音识别中的应用研究。 ANN具有区别复杂分类界限的能力,明显有助于模式识别。 这些研究大多采用基于反向传播算法( BP算法)的多层感知网络。

语音识别技术逐渐向实用化发展,在建立模型、提取和优化特征参数方面取得了突破性进展,使系统具有更好的适应性。 许多发达国家和着名公司投入大量资金开发研究实用化语音识别产品,产生了许多具有代表性的产品。 例如,IBM开发的中文ViaVoice系统、Dragon开发的draganddate系统具有说话者适应能力,可以在用户使用中提高识别率。

21世纪以来,深入的学习技术大大促进了语音识别技术的进步,大大提高了识别精度,应用得到了广泛发展。 2009年,Hinton将深度神经网络( DNN )应用于语音声学建模,在TIMIT中取得了最好的结果。 2011年底,微软研究院俞栋、邓力将DNN技术应用于大词汇连续语音识别任务,大大降低了语音识别错误率。 从此语音识别进入DNN-HMM时代。 DNN的优点是显着提高状态分类概率,不必假定声音数据的分布,因为连接相邻的声音帧包括声音的时间序列结构信息。 同时,DNN具有较强的环境学习能力,可以提高对噪音和口音的鲁棒性。

目前语音识别技术正在应用于工业、通信、商务、家电、医疗、汽车电子、家庭服务等各个领域。 例如,现在流行的手机语音助手将语音识别技术应用于智能手机,实现人与手机的智能对话。 其中包括美国苹果公司的Siri语音助手、智能360语音助手、百度语音助手等。

机器人和有机生命越来越接近

机器人广泛包括模拟人类行为和思想的所有机器,以及模拟其他生物的机器(例如机器狗、机器猫等)。 目前,智能机器人已经成为世界各国研究的热点之一,成为衡量一国工业化水平的重要标志。

随着机器人技术的发展和各行业需求的不断增加,计算机技术、网络技术、MEMS技术等新技术的发展,近年来,机器人技术从传统的工业制造领域迅速扩展到医疗服务、教育娱乐、勘探测量、生物工程、灾害救援等领域 过去几十年,机器人技术的研究与应用大力推进了人类的工业化和现代化进程,形成了机器人的产业链,机器人的应用范围也越来越广泛。

在机器人着眼于工业生产的同时,机器人技术的研究也越来越深入。 1961年,美国麻省理工大学Lincoln实验室将搭载接触传感器的遥控操纵器的从动部分与计算机连接起来,形成的机器人可以通过触觉决定物体的状态。 之后,以电视摄像机为输入的计算机图像处理、物体识别的研究也陆续取得了成果。 1968年,美国斯坦福人工智能研究所的J.McCarthy等人研究了开发具有手、眼、耳的计算机系统的新课题。 于是,智能机器人的研究形象变得丰富起来。

70年代以来,机器人产业蓬勃兴起,机器人技术发展为专业学科。 工业机器人首先在汽车制造业的流水线生产中开始大规模应用,之后,日本、德国、美国等制造业发达国家在其他工业生产中也开始大量采用机器人作业。

此后,机器人越来越向智能化的方向发展,该机器人具有多种传感器,能够融合从多种传感器中获得的信息,有效适应不断变化的环境,具有较强的适应能力、学习能力和自律功能。

智能机器人的发展主要经历了三个阶段。 是可编程试制型机器人、再现型机器人、具有感知能力和适应能力的机器人、智能机器人。 其中相关的关键技术包括多传感器信息融合、导航与定位、路径规划、机器人视觉智能控制与人机接口技术等。

进入21世纪,随着劳动力成本的上升和技术的进步,各国纷纷进行制造业的变革和升级,出现了代替机器人的热潮。 同时,人工智能的发展日新月异,服务机器人也开始进入普通家庭的生活。

世界上许多机器人技术公司都在大力发展机器人技术,机器人的特质和有机生命越来越接近。 最近,波士顿动力公司在机器人领域的成果备受瞩目,其产品狗Spot和双足人偶机器人Atlas令人吃惊。 Spot的功能非常先进,能够告知应该去的目的地,避开障碍,在极端的状况下保持平衡。 Spot还可以承载多达4个硬件模块,为公司提供多个其他机器人完成特定工作所必需的技能,Atlas已掌握倒立、360度翻转、旋转等多种技能,在展示跑步、倒车等绝技后,Atlas

大家都在看

相关专题