模式识别就是识别出特定事物,然后得出这些事物的特征。
模式识别简史
1929年 G. Tauschek发明阅读机 ,能够阅读0-9的数字。
30年代 Fisher提出统计分类理论,奠定了统计模式识别的基础。
50年代 Noam Chemsky 提出形式语言理论——傅京荪 提出句法结构模式识别。
60年代 L.A.Zadeh提出了模糊集理论,模糊模式识别方法得以发展和应用。
80年代以Hopfield网、BP网为代表神经网络模型导致人工神经元网络复活,并在模式识别得到较广泛的应用。
90年代小样本学习理论,支持向量机也受到了很大的重视。
模式分类的主要方法
1.数据聚类
目标:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集。
是一种非监督学习的方法,解决方案是数据驱动的
2.统计分类
基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法。
特征向量分布的获得是基于一个类别已知的训练样本集。
是一种监督分类的方法,分类器是概念驱动的。
3.结构模式识别
该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。
识别采用结构匹配的形式,通过计算一个匹配程度值(matching score)来评估一个未知的对象或未知对象某些部分与某种典型模式的关系如何。
当成功地制定出了一组可以描述对象部分之间关系的规则后,可以应用一种特殊的结构模式识别方法 – 句法模式识别,来检查一个模式基元的序列是否遵守某种规则,即句法规则或语法。
4.神经网络
神经网络是受人脑组织的生理学启发而创立的。
由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以在不同的神经元之间传递增强或抑制信号。
增强或抑制是通过调整神经元相互间联系的权重系数来(weight)实现。
神经网络可以实现监督和非监督学习条件下的分类。
模式识别系统的基本构成
数据获取:用计算机可以运算的符号来表示所研究的对象
–二维图像:文字、指纹、地图、照片等
–一维波形:脑电图、心电图、季节震动波形等
–物理参量和逻辑值:体温、化验数据、参量正常与否的描述
预处理单元:去噪声,提取有用信息,并对输入测量仪器或其它因素所造成的退化现象进行复原
特征提取和选择:对原始数据进行变换,得到最能反映分类本质的特征
测量空间:原始数据组成的空间
特征空间:分类识别赖以进行的空间
模式表示:维数较高的测量空间->维数较低的特征空间
分类决策:在特征空间中用模式识别方法把被识别对象归为某一类别
基本做法:在样本训练集基础上确定某个判决规则,使得按这种规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小
模式识别相关的学科
•统计学
•概率论
•线性代数(矩阵计算)
•形式语言
•机器学习
•人工智能
•图像处理
•计算机视觉
教材/参考文献
1.R. Duda, P. Hart, D. Stork, Pattern Classification, second edition, 2000(有中译本).
2.边肇祺,模式识别(第二版),清华大学出版社,2000。
3.蔡元龙,模式识别,西北电讯工程学院出版社,1986。
模式识别的应用(举例)
生物学
自动细胞学、染色体特性研究、遗传研究
天文学
天文望远镜图像分析、自动光谱学
经济学
股票交易预测、企业行为分析
医学
心电图分析、脑电图分析、医学图像分析
工程
产品缺陷检测、特征识别、语音识别、自动导航系统、污染分析
军事
航空摄像分析、雷达和声纳信号检测和分类、自动目标识别
安全
指纹识别、人脸识别、监视和报警系统