网站首页 > 人工智能AI > 人工智能技术物体识别技术进阶之路：让机器感知三维世界 - 模式识别多智时代正文

物体识别技术进阶之路：让机器感知三维世界 - 模式识别多智时代

admin 2020/02/27 人工智能技术 108℃

人工智能

StArting from image recOGnition

image recognition[db:标签]�[db:标签]的是使用计算机处理、分析和理解图像，以便以不同模式识别目标和对象的技术。图像识别的发展经历了三个阶段:字符识别、数字图像处理和识别、目标识别。对

字符识别的研究始于1950年。它通常能识别字母、数字和符号。它被广泛应用于从印刷体字符识别到手写字符识别。

数字图像处理和识别的研究始于1965年。与模拟图像相比，数字图像具有存储、传输方便、可压缩、传输时不易失真、处理方便等优点。这些都为图像识别技术的发展提供了强大的推动力。

对象识别主要是指对三维世界的对象和环境的感知和理解，属于高级计算机视觉的范畴。它是基于数字图像处理和识别的人工智能、系统学等学科相结合的研究方向。其研究成果被广泛应用于各个行业和检测机器人。

对象识别简史

20世纪60年代

那时，麻省理工学院的计算机教授为本科生组织了一个为期两个月的暑期项目。本项目的目的是设计一个能够智能识别场景中的物体并区分类别的系统。显然，他们当时低估了问题的难度，结果可想而知。

事实上，识别问题本身并不容易。为什么？首先，我们看到的这个物体只是它在特定背景和特定光线条件下以特定角度的投影。改变角度可能完全不同。即使同一个物体，比如一个人，正躺着或站着，它的形状也是不同的。

从20世纪50年代早期到90年代

这个时期基本上是试图通过创建三维模型来识别物体。通常，预先定义一些基本几何形状，然后将对象表示为基本几何形状的组合，然后匹配图像。此时，识别问题变成了匹配问题。在三维模型库中搜索可能的透视投影，并与待识别图像匹配。如果找到最合适的匹配，则认为识别成功。

但这不是很有效。首先，许多物体很难用所谓的基本几何来描述，尤其是一些非刚体，如动物。其次，对于一类物体，即使同一物体在不同的姿态下有所不同，它也可能有丰富的类内差异。不可能预先为每个姿势创建三维模型模板。第三，即使解决了前面的问题，也很难从图像中准确地提取这些几何形状。

90后

目前的主流方法是只考虑图像本身，而不是物体的原始三维形状。这种方法通常被称为基于外观的技术。当从模式识别的角度描述时，所谓的外观是图像特征，它是图像的抽象描述。对于图像特征，可以在这个特征空间中进行匹配或分类。

然而，这种方法仍有许多问题。首先，它要求我们对齐所有的图片，比如人脸图像，这要求每张图片中的人脸特征基本上在一个固定的位置。然而，在许多应用场景中，目标不像人脸那样规则，并且很难进行一致的对齐。此外，这种基于全局特征和简单欧氏距离的检索方法不适用于复杂背景、遮挡和几何变化。自2000年以来，在“认可”方面取得了巨大进步。首先，在图像特征层，人们设计了各种图像特征，如SIFT、HOG、LBP等。同时，机器学习方法的发展也为模式识别提供了各种强大的分类器。后来，人们也做了一些建模对象的工作，目的是用更灵活的模型而不是单一的模板来定义对象。

随着人工智能、大数据和深度学习技术的不断发展，以及3D传感器和深度相机等硬件的不断升级，利用深度信息的3D对象识别技术逐渐吸引了苹果和高通等技术巨头的注意，并已被嵌入

例如，苹果将推出的新一代手机可能配备了3D扫描识别技术，即在传统平面识别的基础上，它可以识别人脸或物体的3D外部轮廓。例如，该系统可以扫描三维人脸，从而大大提高识别精度。这项技术还避免了过去用一张照片欺骗飞机识别系统的问题。

在不久的将来，智能生命肯定会完全进入我们的生活。有兴趣进入未来前沿产业的朋友可以收集智能生命，及时获取前沿信息和人工智能、大数据、云计算和物联网的基础知识。让我们携手引领人工智能的未来！

物体识别技术进阶之路：让机器感知三维世界 - 模式识别 多智时代

猜你喜欢

物体识别技术进阶之路：让机器感知三维世界 - 模式识别多智时代