目录
图像识别难点:跨越语义鸿沟
基于规则的分类方法
数据驱动的图像分类方法
图像表示:
分类器:
损失函数
优化方法
训练过程
决策
2.设计
线性分类器:
损失函数
示例:
学习目标:
入门计算机视觉第二天 图像分类与线性分类器
学习内容:
- 图像识别难点:跨越语义鸿沟
- 基于规则的分类方法
- 数据驱动的图像分类方法
- 图像表示:
- 分类器:
- 损失函数
- 优化方法
- 训练过程
- 决策
学习时间:
2021年1月23日-中午
学习产出:
1、 笔记 21遍
2、CSDN 技术博客 1 篇
打个小广告:各大影视会员共享账号等等点击——> 链接下单
图像识别难点:跨越语义鸿沟
要点:视角,光照,遮挡,形变,环境杂波,内类形变,运动模糊...
基于规则的分类方法
是否可行?通过硬编码的方法是否可行?——>非常困难的事情
数据驱动的图像分类方法
1 ,数据集构建
2,分类器设计
图像表示:
1:像素表示
2:全局特征表示(如GIST)
3:局部特征表示(如SIFT)
3,分类器的决策
分类器:
>近邻分类器
>贝叶斯分类器
>线性分类器
>支撑向量机分类器
>神经网络分类器
>随机森林
>Adaboost
损失函数
0-1损失
>多类支撑向量机损失
>交叉嫡损失
>L1损失
>L2损失
优化方法
>一阶方法
·梯度下降·随机梯度下降
·小批量随机梯度下降
>二阶方法
·牛顿法
. BFGS
.L-BFGS
训练过程
>数据集划分
>数据预处理
>数据增强
>欠拟合与过拟合
>减小算法复杂度
>使用权重正则项
>使用droput正则化
>超参数调整
>模型集成
决策
2.设计
线性分类器:
W权值向量是在一个训练模板权值里进行计算得分最高为最似值,b为偏置。如:下图
损失函数
什么是损失函数?
损失函数搭建了模型性能与模型参数之间的桥梁指导模型参数优化。
损失函数是一个函数,用于度量给定分类器的预测值与真实值
的不一致程度,其输出通常是一个非负实值。
其输出的非负实值可以作为反馈信号来对分类器参数进行调整,
以降低当前示例对应的损失值,提升分类器的分类效果。
x表示数据集中第i张图片;
f(x,,W)为分类器对x的类别预测;y为样本i真实类别标签(整数);L;为第i个样本的损失当预测值;
L为数据集损失,它是数据集中所有样本损失的平均。
max(0,·)损失 常被称为折页损失(hingeloss)
示例:
假设有3个类别的训练样本各一张,分类器是线性分类器f(x,W) = Wx +b,其中权值W,b已知,分类器对三个样本的打分如下:
当前分类器对于鸟这张图像的损失:
其余类似计算可得 图像损失。
打个小广告:各大影视会员共享账号等等点击——> 链接下单