相关概念:
模式:
模式的定义:
为了让机器执行和完成识别任务,必须对分类识别对象进行科学的抽象,建立其数学模型,用以描述和代替识别对象,这种对象的描述就是模式。
模式的表现形式:
特征矢量、符号串、图、关系式
模式识别的概念:
根据研究对象的特征或者属性,运用一定的分析算法认定其类别,并且分类识别的结果尽可能地符合真实。
模式识别地应用:
具有视觉地机器人、生物特征识别、遥感图片的机器判读等、汽车自动驾驶系统;
模式识别系统的过程:
模式识别的三个核心问题:特征提取与选择、学习训练、分类识别
特征提取与选择:
特征提取式对研究对象本质的特征进行测量并且将结果数值化或将对象分解并符号化,形成特征矢量,符号串或关系图,产生代表对象的模式。特征选择式在满足分类识别正确率的条件下,按照某种准则尽量选用对正确分类识别作用较大的特征,从而用较少的特征来完成分类识别任务。
(1)模式采集
摄像,录音,数字相机,电视,红外,激光,声纳,雷达,遥感,A/D转换。
在模式采集和预处理中一般要用到模数(A/D)转换。A/D转换必须注意两个问题:
a.采样率,必须满足采样定理;
b.量化等级,取决于精度要求;
(2)预处理
a.去噪声:消除或减少模式采集中的噪声及其他干扰,提高信杂比;
b.去模糊:消除或减少数据图像模糊(包括运动模糊)及几何失真,提高清晰度;
c.模式结构转换:例如把非线性模式转化为线性模式,以利于后续处理。
预处理的方法主要有:滤波,变换,编码,归一化等。
(3)特征提取/选择
目的:降低维数,减少处理消耗,使分类错误比较小。从模式空间中选择最有利于模式分类的量作为特征,压缩模式维数,以便于处理,减少消耗。
特征提取:一般以分类中使用的某种判决规则为准则。所提取的特征使在某种准则下的分类错误最少。为此需要考虑特征之间的统计关系,选用适当的正交变换,才能提取出最有效的特征。
特征选择:需要某种分类准则,在该准则下选择对分类贡献较大的特征,删除贡献较小的特征。
学习训练:
使机器具有分类识别功能,首先对其进行训练,将人类的识别知识和方法以及关于分类识别对象的知识输入机器中,产生分类识别的规则和分析程序。
分类识别:
机器中的分类识别知识与待识别对象越匹配,知识的运用越合理,系统的识别功能就越强,正确率就越高。
分类:把特征空间划分为类空间。把未知类别属性的样本确定为类空间中的某一类型。影响分类错误率的因数:
a.分类方法
b.分类器设计
c.提取的特征
d.样本质量
模式识别的主流技术有:
统计模式识别:直接利用各类分布特征,或隐含的利用概率密度函数、后验概率等概念进行识别。基本的技术有聚类分析、判别类域代数界面法、统计决策法,最近邻法等;
结构模式识别:将对象分解为若干个基本单元,即基元;其结构关系可以用字符串或图来表示,即句子;通过对句子进行句法分析,根据文法而决定其类别;
模糊模式识别:将模式或模式类作为模式集,将其属性转化为隶属度,运用隶属度函数、模糊关系或模糊推理进行分类识别;
人工神经网络方法:由大量简单的基本单元,即神经元相互连接而成的非线性动态系统,在自学习,自组织,联想及容错方面能力强,能用于联想、识别和决策。
人工智能方法:研究如何使机器具有人脑功能的理论和方法;
子空间法:根据各类训练样本的相关阵通过线性变换由原始模式特征空间产生各类对应的子空间,每个子空间与每个类别一一对应;
模式识别的基本原则: