网站首页 > 人工智能AI > 人工智能技术人脸识别、文字识别背后的方法，模式识别是什么？ - 模式识别多智时代正文

人脸识别、文字识别背后的方法，模式识别是什么？ - 模式识别多智时代

admin 2020/02/27 人工智能技术 103℃

[db:标签]��式识别？

作为人工智能的一个重要方向，模式识别的主要任务是模拟人类的感知，如通过视觉和听觉信息来识别和理解环境，也称为“机器感知”或“智能感知”。

当人们观察事物或现象时，他们经常会寻找它们与其他事物或现象之间的差异，并根据特定的目的将具有不同细节的相似事物或现象分组。字符识别就是一个典型的例子。例如，数字“4”可以用多种方式书写，但都属于同一类别。人脑具有很强的模式识别和泛化能力。尽管它以前没有见过“4”以不同的方式书写，但它可以被归入“4”所属的类别。人脑对模式(事物、现象等)进行分类和归类的能力。)是模式识别，即感知。

随着20世纪40年代电子计算机的出现和50年代人工智能的兴起，模式识别在60年代早期迅速发展成为一门新学科。21世纪以来，模式识别逐渐与深度学习融合。近年来，深度学习和大数据的出现促进了模式识别的快速发展。

对此，刘成林解释道，“模式识别是一项智能任务，也是人工智能的一种形式。机器学习，包括深度学习，是模式识别背后的基本方法。通过学习(训练)，机器有识别模式的能力。目前，利用深度学习实现模式识别可以更好地解决这个问题

深度学习作为一种机器学习，是对生物神经网络结构和信息处理机制的简单模拟。人工神经网络早在20世纪40年代就被研究，并在20世纪50年代和80年代产生了巨大影响。近年来，随着计算能力的提高，可以训练更多层的神经网络(称为深度神经网络)来提高数据拟合和识别能力，有的甚至达到1000层。深度学习通常指使用深度神经网络进行学习。

在复杂条件下，由于深度学习，人脸识别的准确率低于50%

。目前，人脸识别和文本识别都是人工智能领域的成功应用，可以看作是深度学习形成的模式识别的主要研究成果之一。

但是刘成林认为尽管人脸识别和字符识别已经被广泛使用，但是它们并没有被“很好地应用”。目前，人脸识别在门禁、通关等领域的应用较为成熟，因为被识别的物体能够主动配合，靠近摄像头，能够捕捉到更清晰的图像。在用户协作和可控照明的情况下，许多制造商可以在场景中实现99%以上的人脸识别准确率。然而，在更复杂的情况下，例如不均匀的室外照明、长距离和可变的面部视角，如果用监控摄像机进行面部识别，识别精度将显著降低。

目前，在电脑前端增加人工智能模块只能起到辅助作用。复杂条件下的人脸识别仍然难以达到成熟应用的水平。刘成林说，在户外自然光条件下，“人脸识别的正确率不到50%”。

在文本识别领域也是如此。字符识别目前主要用于书籍和报纸的数字化。报纸、金融机构、保险机构和快递行业中的大量文档需要以电子方式检索、管理和分析大数据。司法部门提倡智能执法，用于处理案件的文件(打印和手写)需要电子化。医院案例、教育领域的作业、试卷等。也有很大的电子需求。

像人脸识别一样，图像清晰度和光照也是文本识别的主要困难。由于光照均匀，平板扫描仪可以扫描高清晰度和高识别率的纸质材料。然而，拍照图片的识别率会降低，户外自然场景图片中的文本检测和识别是当今研究的热点和难点。

对抗学习和脑科学并肩工作来加速人工智能过程。

为了克服低分辨率和照明的问题

对抗学习是一种非常新的机器学习方法，由加拿大学者伊恩·古德费勒首先提出。实现对抗学习的方法是让两个网络相互竞争并“玩游戏”。其中之一是生成器网络，它连续捕获训练数据库中真实图像的概率分布，并将输入的随机噪声转换成新的样本(即虚假数据)。另一种是鉴别网络，可以同时观察真假数据，判断数据的真伪。通过反复对抗，发生器和鉴别器的能力将不断增强，直到达到平衡，最终发生器可以产生具有假图像和真图像的高质量图像。

字符识别领域要解决的问题不仅是上述照片和手写识别，还有小样本条件下的字符识别，如古籍的识别，这也是一个很大的挑战，因为用于训练的标记样本不足，很难获得很高的识别率进行深入学习。

小样本的泛化、适应性、可解释性和鲁棒性是当前基于深度学习的模式识别技术的主要局限性，而这些正是人脑的优势。因此，模式识别可以从脑科学和神经科学中寻求新的参考，发展基于类人感知和认知机制的模式识别学习的新理论和新方法。

以概括能力为例。当训练样本很小时，可以为训练设计一个类似于人的记忆的模型，这样机器就可以记住字符的结构和关键特征，例如组成字符的笔画、组合和关系。这个模型被称为“世代模型”。它能记住每种类型模型的关键特征和分布，并能生成数据，如符合基本结构的笔迹和一种类型字符的不同细节。生成的模型也有很好的解释。在识别模式时，它可以解释模式由哪些部分组成以及这些部分之间的关系。

模式识别、深度学习、对抗学习、脑科学…越来越多的人工智能研究路径已经进入我们的视野。对于人工智能的未来发展，刘成林也认为深入学习仍将是人工智能研究的主流，但对抗学习、脑科学和认知科学等理论方法将与之融合，共同促进人工智能的发展。

希伯来理论——希伯来学习:希伯来学习是一种神经科学理论，它认为突触后细胞敏感性的增加是由突出前细胞对突出后细胞的重复或持续刺激造成的。这一理论解释了突触的可塑性，即大脑神经元在学习过程中的适应性，在人工神经网络的研究中也发挥了重要作用。它也可以被称为赫布规则或赫布假说。

在不久的将来，智能生命肯定会完全进入我们的生活。有兴趣进入未来前沿产业的朋友可以收集智能生命，及时获取前沿信息和人工智能、大数据、云计算和物联网的基础知识。让我们携手引领人工智能的未来！

上一篇：学完高等数学可以做哪些有意思的事情？ - 模式识别多智时代
下一篇：数据挖掘与机器学习的区别 - 模式识别多智时代

人脸识别、文字识别背后的方法，模式识别是什么？ - 模式识别 多智时代

猜你喜欢

人脸识别、文字识别背后的方法，模式识别是什么？ - 模式识别多智时代