什么是模式识别

模式识别:根据已有知识的表达,针对待识别模式,判别其决策所属的类别或者预测其对应的回归值。
分类:输出量是离散的类型表达,即输出待识别模式所属的类别。
回归:输出量是单个/多个维度的连续信号表达(回归值)。
回归是分类的基础:离散的类别值是由回归值做判别决策得到的。

模式识别数学表达

数学解释:模式识别可以看作一种函数映射f(x),将待识别模式 x 从输入空间映射到输出空间。

输入空间:原始输入数据 x 所在的空间,空间维度:输入数据的维度

输出空间:输出的类别/回归值y所在的空间,空间维度:1维、类别的个数、回归值维度

特征向量:

大模型意图识别 python 模型的识别状态_泛化

特征向量的相关性

欧式距离:

大模型意图识别 python 模型的识别状态_大模型意图识别 python_02

机器学习基本概念

模型的参数和结构:

大模型意图识别 python 模型的识别状态_泛化_03

线性模型:

大模型意图识别 python 模型的识别状态_大模型意图识别 python_04

非线性模型:

大模型意图识别 python 模型的识别状态_模式识别_05

样本量 vs 模型参数量

  • 训练样本个数 = 模型参数个数 :参数有唯一解
  • 训练样本个数 > 模型参数个数 :没有准确的解
  • 训练样本个数 < 模型参数个数 :无数个解/无解

目标函数:以待学习的模型参数作为自变量,以训练样本作为给定量的函数。

大模型意图识别 python 模型的识别状态_泛化_06

优化算法:

大模型意图识别 python 模型的识别状态_大模型意图识别 python_07

机器学习流程示意图:

大模型意图识别 python 模型的识别状态_特征向量_08

监督式学习:

大模型意图识别 python 模型的识别状态_模式识别_09

无监督式学习:

大模型意图识别 python 模型的识别状态_大模型意图识别 python_10

模型的泛化能力

训练集:模型训练所用的样本数据。
测试集:测试模型性能所用的样本数据。
误差:模型给出的预测/决策输出与真值之间的差异。
训练误差:模型在训练集上的误差。
测试误差:模型在测试集上的误差。它反映了模型的泛化能力,也称作泛化误差。
过拟合:模型训练阶段表现很好,但是在测试阶段表现很差。

评估方法和性能指标

留出法:

大模型意图识别 python 模型的识别状态_模式识别_11

二分类问题性能指标:

大模型意图识别 python 模型的识别状态_模式识别_12