1月19日,“行业论坛上海站”,上海市长宁区华阳路街道办事处主任林子月;安百里商业互联网创新中心创新服务与孵化器总经理高格;阿里巴巴集团高级产品专家陈家驹;赵冠电子首席技术官周吉;于洪涛,北汽信息产品研发与交付中心主任;华为中国软国际云生态总监王;倪华,商务厅厅长;易欧公司上海分公司总经理苗国成出席论坛,与众多企业家进行了热烈讨论。
以下是兆冠电子首席技术官周吉博士精彩的演讲:
刚才组织者(十亿欧洲公司)特别强调,要使科学技术更加平等,平等的前提是充分理解和传播。所以今天我想借此机会谈谈一项技术。
首先,我想介绍一下兆冠电子从事什么样的技术研究。我们的主要技术要点是视觉、人工智能和芯片设计。我们之所以选择这三个方面作为我们的技术支持点,是因为如果我们现在想从软件到硬件制定解决方案,这三个方面必须包括在内。
对于人工智能视觉,我认为主要有两个研究方向:一是基于内容的理解,它不仅能识别物体和场景,也是目前人工智能研究的热点另一个是基于对几何的理解。我们不仅需要知道它是什么,还需要知道它离我有多远,它的几何特征是什么。这是对几何学的理解。
基于人工智能的几何理解不是一个热门话题,但在不久的将来可能会超过内容理解。因为当在复杂的环境中自由行动时,仅仅知道这是一个人是不够的。你需要知道离他有多远以及如何避开障碍。
几何理解是以大量的数学和几何学为基础的。我认为这是人工智能的最大障碍。你也许能够让人工智能理解一些事情,讲一个故事或者写一篇文章,因为只要人们感觉舒适和良好,就没有特别客观的评价标准。然而,基于几何的理解是不同的。它真的需要精确到几毫米和几度,并且有非常客观的测量标准。因此,我认为人工智能只在几何理解中起辅助作用,而潜在的数学、几何甚至物理原理才是真正起主导作用的东西。
目前,真正能够实现相对精确导航的传感器只有相机和激光雷达。
在超速行驶的过程中,汽车不仅能够识别交通标志,还必须能够识别障碍物和避开车辆,这是一个典型的几何应用场景。在这种场景中,激光雷达用于定位。它的优点是测距精度很高。其次,由于保证了精度,它不需要很高的计算能力,易于开发和着陆。
和照相机和雷达是完全互补的照相机的优点是便宜。一般来说,许多照相机每台要花几十美元。第二,相机使用寿命长,没有机械运动部件。第三,相机能获取的信息量远远大于激光雷达。
从商业角度来看,价格是王只要任何东西达到“类似”的效果,价格降低20%,它肯定会把高价商品推出市场,这也是它的商业价值
我的看法是,在中低速区域,相机将取代激光雷达,而在高速区域,这是另一回事,因为安全要求太高。
目前,没有一个系统,无论是清扫机器人还是自动数据采集系统,真正使用照相机并放弃激光雷达。这是因为以前没有合适的视觉芯片可以使用,限制了视觉处理技术的发展。当前人工智能技术突飞猛进,使得传统视觉中的技术瓶颈迅速突破。其次,芯片设计和制造技术的发展极大地提高了我们的计算能力。所有这些使得视觉处理技术的应用越来越广泛
任何电子系统都以计算能力、功耗和成本为核心指标一个好的着陆计算机视觉定位和绘图算法需要强有力的硬件支持。随着芯片制造和芯片设计的发展,这个瓶颈已经不再是瓶颈。
虽然VSLAM本身是一项长期的技术,但它的数学模型非常好,我们还没有看到一种纯视觉的导航方法。这是因为我们的生活充满了噪音。噪音的出现使问题变得极其复杂。例如,图像在不同的光照条件下具有不同的信噪比。因此,处理这样的信息需要非常高的计算能力。
此外,对于相机,单点定位精度远低于激光雷达。目前,学术界和工业界的研究重点主要是直接用人工智能制作虚拟实境建模语言(VSLAM),而不是像我刚才所说的那样将人工智能引入一个更大的数学和几何框架。用人工智能直接制作虚拟实境地图,我觉得就像是让某人在上海人民广场周围画一个圈,然后让他画人民广场的地图,这个结果与实际的准确度相差甚远。
既然我们在制造VSLAM,我们就不是在对抗一条看不见的龙。我们有明确的目标。
我们评估系统是否准确。一般来说,我们看这个系统的离差率。人们认为你走得越长,距离越长,误差就越大。
目前,我们在这方面做了大量的工作。这项工作分为两部分:一是连续实验我们已经建立了许多实验系统另一部分是形式,用数学形式表达形式上,我们现在已经观察到一些现象或规律:
首先,噪声模型在整个系统中起着非常关键的作用我们当前的VSLAM系统是确定性系统,也就是说,它们试图从我们的解决方案中消除噪声。然而,为了更加精确,噪声模型变得非常关键。
其次,我们发现在整个SLAM过程中有三个要素:定位、映射和跟踪只要其中两个因素是准确的,第三个因素就会自动准确,这是一个非常重要的规律性问题。
第三,因为我们知道在SLAM过程中,相机不断地拍照,每张照片都是一种度量。尽管每次测量都有噪声,但整合所有信息以产生更准确的结果是非常重要的。换句话说,正如我刚才所说的,当时间间隔无限时,误差趋于零。整个系统必须是一个反馈系统。你制造的信息,你得到的信息,从中提取出一般的东西并反馈回来。
最终,所有的神经网络都知道维度的诅咒。换句话说,维度越高,优化就越困难。当我们设计整个系统时,降维是非常关键的。如何将维数降低到一个几何系统是非常关键的我认为这些发现对于设计和实现我们需要的精确系统非常关键目前似乎许多人只能用自然语言来描述这些东西,这还不足以把它们变成程序和算法。为了将它们转化为算法,我们需要制定和形式化许多东西。这是我们现在致力于做的事情。理论的发展、算法的实现和芯片的性能使我们具备了在“使智能设备能够自主地从a点移动到b点”领域取得突破的良好条件。