向量的相似度

考虑M个类型的模式,它们分别记作

java 向量相似度计算 包 向量相似性质_python

,编号随意。假定通过已知类型属性的观测样本,业已抽取出M个样本模式向量

java 向量相似度计算 包 向量相似性质_python_02

。给定一任意的未知模式向量

java 向量相似度计算 包 向量相似性质_算法_03

,希望判断它归属于哪一类模式。这个问题称为模式分类,它是模式识别的基本问题之一。模式分类的基本思想是将未知模式向量

java 向量相似度计算 包 向量相似性质_算法_03

同M个样本模式向量进行比对,看

java 向量相似度计算 包 向量相似性质_算法_03

与哪一个样本模式向量最相似,并据此作出模式分类的判断。假定

java 向量相似度计算 包 向量相似性质_算法_06

分别作为术知模式向量

java 向量相似度计算 包 向量相似性质_算法_03

和已知样本模式向量

java 向量相似度计算 包 向量相似性质_python_02

之间的相似关系的符号。以

java 向量相似度计算 包 向量相似性质_算法_03


java 向量相似度计算 包 向量相似性质_算法_10

的相似关系为例,若 

java 向量相似度计算 包 向量相似性质_相似度_11

则称未知模式向量

java 向量相似度计算 包 向量相似性质_算法_03

 与样本模式向量

java 向量相似度计算 包 向量相似性质_矩阵_13

更相似。

相似度(similarity)或相异度(dissirmilarity ):

最简单和最直观的相似度是两个向量之间的Euclidean距离

未知模式向量

java 向量相似度计算 包 向量相似性质_算法_03

与第主个原象模式向量

java 向量相似度计算 包 向量相似性质_矩阵_15

之间的 Euclidean距离记作

java 向量相似度计算 包 向量相似性质_相似度_16

,定义为 

java 向量相似度计算 包 向量相似性质_相似度_17

Mahalanobis距离

java 向量相似度计算 包 向量相似性质_java 向量相似度计算 包_18

代表N个样本模式向量的均值向量。

再令

java 向量相似度计算 包 向量相似性质_相似度_19

表示N个样本模式向量的协方差矩阵。

从未知模式向量

java 向量相似度计算 包 向量相似性质_算法_03

到均值向量

java 向量相似度计算 包 向量相似性质_python_21

之间的Mahalanobis 距离定义为

java 向量相似度计算 包 向量相似性质_算法_22

从第主个样本模式向量

java 向量相似度计算 包 向量相似性质_矩阵_15

到均值向量

java 向量相似度计算 包 向量相似性质_python_21

的 Mahalanobis 距离定义为

java 向量相似度计算 包 向量相似性质_python_25

根据近邻分类法,将未知模式向量

java 向量相似度计算 包 向量相似性质_算法_03

归为满足

java 向量相似度计算 包 向量相似性质_算法_27

的近邻

java 向量相似度计算 包 向量相似性质_矩阵_15

所属的模式类型。

 两个向量之间的相似度的测度不一定局限于距离函数。两个向量的夹角的余弦函数

java 向量相似度计算 包 向量相似性质_矩阵_29


java 向量相似度计算 包 向量相似性质_java 向量相似度计算 包_30

,

java 向量相似度计算 包 向量相似性质_相似度_31

成立,则认为未知模式向量

java 向量相似度计算 包 向量相似性质_算法_03

与样本模式向量

java 向量相似度计算 包 向量相似性质_矩阵_15

最相似。上式的变型

java 向量相似度计算 包 向量相似性质_python_34

称为Tanirnoto测度。

待分类的信号称为目标信号,分类通常是根据菜种物理或几何概念进行的。令X为目标信号,

java 向量相似度计算 包 向量相似性质_python_35

代表第i类目标的分类概念。于是,可以有这种的关系:

java 向量相似度计算 包 向量相似性质_python_36

这类有效关系一般用目标–概念距离(object-concept distance)

java 向量相似度计算 包 向量相似性质_相似度_37

描述420。因此,若日标–概念距离

java 向量相似度计算 包 向量相似性质_相似度_37

最小,则将X归为第i类目标

java 向量相似度计算 包 向量相似性质_python_39

;。