目录

图像识别难点:跨越语义鸿沟

基于规则的分类方法

数据驱动的图像分类方法

图像表示:

分类器:

损失函数

优化方法

训练过程

          决策

2.设计

线性分类器:

损失函数

示例:


学习目标:

入门计算机视觉第二天 图像分类与线性分类器


学习内容:

  1. 图像识别难点:跨越语义鸿沟
  2. 基于规则的分类方法
  3. 数据驱动的图像分类方法
  4. 图像表示:
  5. 分类器:
  6. 损失函数
  7. 优化方法
  8. 训练过程
  9.           决策

学习时间:

 2021年1月23日-中午


学习产出:

1、 笔记 21遍
2、CSDN 技术博客 1 篇

打个小广告:各大影视会员共享账号等等点击——> 链接下单

图像识别难点:跨越语义鸿沟

要点:视角,光照,遮挡,形变,环境杂波,内类形变,运动模糊...

基于规则的分类方法

是否可行?通过硬编码的方法是否可行?——>非常困难的事情

数据驱动的图像分类方法

1 ,数据集构建

2,分类器设计

goolenet图像分类_线性分类器

图像表示:

1:像素表示

2:全局特征表示(如GIST)

3:局部特征表示(如SIFT)

3,分类器的决策

分类器:

>近邻分类器
>贝叶斯分类器
>线性分类器
>支撑向量机分类器
>神经网络分类器
>随机森林
>Adaboost

损失函数

0-1损失
>多类支撑向量机损失
>交叉嫡损失
>L1损失
>L2损失

优化方法

>一阶方法
·梯度下降·随机梯度下降
·小批量随机梯度下降

>二阶方法
·牛顿法
. BFGS

.L-BFGS

 

训练过程

>数据集划分

>数据预处理

>数据增强
>欠拟合与过拟合
>减小算法复杂度

>使用权重正则项

>使用droput正则化

>超参数调整
>模型集成

 

          决策

goolenet图像分类_深度学习_02

goolenet图像分类_损失函数_03

 

2.设计

goolenet图像分类_goolenet图像分类_04

线性分类器:

goolenet图像分类_线性分类器_05

goolenet图像分类_goolenet图像分类_06

goolenet图像分类_损失函数_07

goolenet图像分类_深度学习_08

W权值向量是在一个训练模板权值里进行计算得分最高为最似值,b为偏置。如:下图

goolenet图像分类_goolenet图像分类_09

goolenet图像分类_深度学习_10

损失函数

什么是损失函数?

损失函数搭建了模型性能与模型参数之间的桥梁指导模型参数优化。
损失函数是一个函数,用于度量给定分类器的预测值与真实值
的不一致程度,其输出通常是一个非负实值。
其输出的非负实值可以作为反馈信号来对分类器参数进行调整,
以降低当前示例对应的损失值,提升分类器的分类效果。

goolenet图像分类_图像识别_11

x表示数据集中第i张图片;
f(x,,W)为分类器对x的类别预测;y为样本i真实类别标签(整数);L;为第i个样本的损失当预测值;
L为数据集损失,它是数据集中所有样本损失的平均。

goolenet图像分类_图像识别_12

max(0,·)损失 常被称为折页损失(hingeloss)

示例:

假设有3个类别的训练样本各一张,分类器是线性分类器f(x,W) = Wx +b,其中权值W,b已知,分类器对三个样本的打分如下:

goolenet图像分类_goolenet图像分类_13

goolenet图像分类_损失函数_14

当前分类器对于鸟这张图像的损失:

goolenet图像分类_线性分类器_15

其余类似计算可得 图像损失。

打个小广告:各大影视会员共享账号等等点击——> 链接下单