1 目录

  • 计算机视觉
  • 卷积神经网络
  • 卷积
  • 池化
  • 特征可视化

2 计算机视觉

计算机视觉发展比较早,在1966年就有相关CV的人工智能论文







计算机视觉应用雏形:




相关应用:

  • 图片分类



  • 目标识别



  • 物体标注



  • Pose 识别



  • 图标标题生成



  • 图片内容理解



  • 视觉问答







  • 图像生成



  • 迁移学习



3 卷积神经网络

我们先回顾下全连接网络:

全连接神经网络(fully connected neural network),顾名思义,就是相邻两层之间任意两个节点之间都有连接。全连接神经网络是最为普通的一种模型(比如和CNN相比),由于是全连接,所以会有更多到权重值和连接,因此也意味着占用更多到内存和计算。



image




卷积神经网络的示意图如下:




4 卷积



卷积不是一个新的概念,在很早以前的索贝算子就应用到,在影像处理及电脑视觉领域中常被用来做边缘检测





tensorflow的卷积层:






TensorFlow的padding操作:




4 池化

池化层的作用: 1. 不变性,更关注是否存在某些特征而不是特征具体的位置。可以看作加了一个很强的先验,让学到的特征要能容忍一些的变化。2. 减小下一层输入大小,减小计算量和参数个数。3. 获得定长输出。(文本分类的时候输入是不定长的,可以通过池化获得定长输出)4. 防止过拟合或有可能会带来欠拟合。


最大池化




一些卷积神经网络变体:

  • LeNet-5



  • AlexNet







  • VGGNet



  • GoogLeNet



  • ResNet