- 图像表示
- 二进制图像,灰度图像,彩色图像
表示为向量:r,g,b拼起来
- 分类器
- 线性分类器(是神经网络(小范围),支撑向量机(大范围)的基础,能组成强大的非线性模型)
- define:
![]]()
步骤
- 图像→向量
- 该图像在每个类别的分数
每个类别都有各自的系数和偏置。输入的图像经过线性变化得到对应每个类别的分数,最高的就判定属于那一类 - 判定类别,贴标签
几何理解: 分类就是寻找决策边界
- 损失函数
举例:
大过一(边界)就认为没有损失
花成函数是右上角的形式(折页函数): 两个s差越大,损失函数值越大 - 当w和b很小时,结果L=N-1. 可以用来验证是否正确。
正则项: - λ衡量了正则项在总损失中占的比重
- 使结果唯一
- 使模型有偏好
- 防止过拟合
随机梯度下降算法: 只选一个样本(用正确率换速度) - 把数据集划分为;训练集(不同超参训练出模型,优化算法来优化)→验证集(选择最优的超参,人为)→测试集
当样本中的数据太少怎么办?
把数据分成不同份,他们分别作验证集,进行多次验证。
也可以也可以在每次重新验证之前先把数据集打乱→带有打乱验证的重复k折验证
数据预处理
- 去均值(去除数据范围影响),归一化(去除量纲影响)。[神经网络多用]
- 去相关性(让不同维度的数据变化无关,当某一维度无变化时,起到降维的结果),白化