1、人工智能之模式识别
关于什么是人工智能,至今还缺少一个权威和统一的定义。但究其根本,始终是指机器能够达到人的智能水平,即:能够像人一样,可以感知外在的事物,并通过自主的思维过程做出有目的、有意义的响应。因此,可以说:人工智能包括了感知、决策和行动三个方面的能力,当然这三项能力的运用都是由机器自主完成的,而不受人类的直接控制。而模式识别技术,正是实现人工智能感知能力的重要技术手段。
2、模式识别的发展
模式识别与其他技术发展一样,也不是突然出现的,而是有其从初级到高级、从实践探索到理论突破的发展过程,期间,已经经过了近百年的历史。
模式识别的本质是对事物的分类。认知过程是建立类别标签和类别模式特征之间关联的过程,而识别,就是将一个具体事物根据特征划归到已知的类别中去。
(1)光电阅读机
作为使机器具有对外界事物感知能力的一种技术,模式识别的发展历史可以追溯到 1929 年奥地利发明家 Tauschek 的光电阅读机。这个装置在一个旋轮上安装了与字母和数字的形状相同的透孔,当一个被强光照亮的字符经过透镜聚焦照射到旋轮上时,如果正好与某一个字符的透孔形状吻合,则透过的光强最强,会驱动旋轮内部的光敏元件发出信号,使阅读机识别出显示的字符。
Tauschek 的阅读机是人类力图让机器具有识别能力的首次尝试,它采用的方法被称为“模板匹配”,也是第一个被实际应用的模式识别方法。
(2)感知器
随着人工智能在上个世纪 50 年代成为研究热点,通过模拟大脑的神经系统结构和运作机理来实现模式识别功能也成为一个重要的研究方向。其中,最为突出的贡献是美国实验心理学家罗森布拉特提出的感知器。他在 1960 年用硬件实现了由 400 个输入信号和 8 个输出信号构成的模式识别机 Mark 1,可以将 20*20的点阵图像识别为 8 种不同的图形。罗森布拉特的感知器除了能够实现识别,更重要的是他还提出了机器学习的算法,即如何训练一个机器,使它具备某种模式识别的能力。
(3)句法模式识别
感知器虽然是以神经元模型为基础,但仍然属于统计模式识别的范畴,就是根据事物特征的取值来进行识别。1974 年美籍华裔计算机专家傅京孙提出的句法模式识别,则是首个完整的利用事物特征之间的结构关系来完成模式识别的算法,因此开创了称为“结构模式识别”的另一种思路。傅京孙还聚集了从事模式识别相关算法研究和工程应用的有关学者,于 1976 年正式成立了国际模式识别学会 IAPR,使得模式识别作为一个独立的学科走上了国际学术舞台。
(4)BP 神经网络模型
自 1969 年以来,因为以感知器为代表的线性分类器不能解决非线性分类问题,所以,整个统计模式识别领域陷入低潮,一直到 1986 年美国认知神经学家Rumelhart 等人提出误差反向传播的多层次神经网络模型 BP 模型后,模式识别才迎来了另一个发展的高潮。
(5)支持向量机(SVM)
由于BP 算法能够处理的神经网络不能太复杂,其模型本身又是高度非线性的,因此,在可解释性和工程应用效果方面都受到很大的局限。而 1995 年由前苏联统计学家和数学家 Vapnik 等人提出的支持向量机,作为一种理论基础严密,优化目标明确,扩展能力强大的模式识别算法,取得了极大的成功。
(6)深度学习
虽然与支持向量机同属统计模式识别算法,但神经网络模型由于面临性能提升和计算量巨大的压力,发展十分缓慢。直到计算机技术、网络技术的快速发展在算力和数据量上做好了准备,算法理论又在 2006 年由 Hinton 等人取得了突破性进展,结构复杂的大规模神经网络才得以实现,并以深度学习技术为核心引领着当今人工智能发展的新一轮浪潮。
3、模式识别的应用
随着计算机技术的快速发展和对于智能系统的强劲需求,模式识别技术在二战以后得到了越来越广泛的应用。目前,只要需要机器具有感知能力和一定的智能响应能力的地方,就有模式识别的应用。
以下在一些领域比较典型的模式识别应用:
(1)信息过滤 Information Filter
在网络搜索和访问的过程中,需要根据信息的内容来确定是否过滤,这已经不是简单的关键字检索能够实现的,必须根据信息的总体内容、出处和上下文关系来确定是否过滤,模式识别技术可以发挥巨大的作用。最早的信息过滤算法是基于文本的,现在已经发展到基于
多媒体信息,包括图像、视频、声音等等。
(2)生物特征识别 Biometrics
利用生物特征来识别人的身份,现在已经从科幻影片中的场景变成了现实。目前生物特征识别技术已从比较成熟的指纹识别、说话人识别、虹膜识别发展到了更加复杂的人脸识别、手印识别、步态识别等方法。
(3)目标跟踪 Target Tracking
目标检测与跟踪也是模式识别的典型应用,大的方面可以应用到导弹制导、自动驾驶等军事领域,小的方面可以应用到智能监控、照相机笑脸识别、眼动控制等领域。
(4)手势识别 Gesture Recognition
手势识别是近年来在人机交互领域的重要进展,通过识别人手的姿势和运动来完成对计算机系统的非接触控制,手势的检测可以依据红外检测、运动和姿态传感器、可见光视频和其它传感器实现,Kinect、MYO 和 Leap Motion 都是比较受关注技术和产品。
(5)音乐识别 Music Recognizing
音乐识别本科音乐分类和旋律识别。音乐分类是根据音乐的特征将其划入到不同的类别中,例如苹果公司的 Genius 技术。旋律识别(Melody Recognizing)是指根据旋律,而不是根据关键字来搜索音乐,是目前音乐检索的最新发展。百度曾经在 2010 年 9 月短暂推出过音乐的哼唱检索,在许多卡拉 OK 点歌系统和手机应用中,也采用了基于哼 唱 的 音 乐 检 索 技 术 。
(6)字符识别 Optical Character Recognition
光学字符识别(OCR)是最早发展的模式识别应用之一,它可分为联机识别和脱机识别,又可以分为手写识别和印刷体识别。目前联机手写识别(掌上设备的手写输入)、脱机印刷体识别(扫描文件的OCR、PDF 文件的拷贝)都发展到了一定的实用水平,比较困难的是脱机手写识别。
(7)图像识别搜索 Image Searching
通过图像的内容来进行检索,而不是根据关键字检索,也是模式识别在图像处理方面的典型应用。由于图像本身的质量差异较大,变化的情况也比较多,目前该领域还处于研究阶段。
(8)自然语言理解 Natural language understanding
自然语言理解(NLU)一直是人工智能领域的研究重点,其研究内容既包括文字的理解,也包括口头对话的理解。目前文字方面进展较大,许多机器翻译系统已经可以投入实用,例如 Google 的在线翻译
(9)脑电识别 Electroencephalograph Recognition
对于脑电信号的识别,是一项非常前沿的研究工作。它不仅可以用于“读脑”,获知人的思维活动,而且可以用于“脑电控制”,帮助残疾人或者特殊人员(例如战斗机的驾驶员)控制各种设备完成预定任务。
(10)环境识别 Environment Recognition
环境识别是对周边环境类型和状态的识别技术,在无人驾驶汽车、自主外星探测器等系统中十分重要,Google Glass 等先进的随身环境感知和信息处理设备中,环境识别也是重要的组成部分。
4、模式识别系统
5、模式识别算法体系
以上内容根据北京理工大学模式识别课程整理。