Tensorflow入门与实战学习笔记（十一）-预训练网络

在2014年，VGG模型架构由Simonyan和Zisserman提出，在“极深的大规模图像识别卷积网络”（Very Deep Convolutional Networks for Large Scale Image Recognition）这篇论文中有介绍VGG模型结构简单有效，前几层仅使用3×3卷积核来增加网络深度，通过max pooling（最大池化）依次减少每层的神经元数量，最后三层分别是2个有4096个神经元的全连接层 和一个softmax层。

但其实现在已经是落伍了，我们后面会通过实验证明，不过VGG系列与我们之前所学非常类似所以需要分析他

1.3.1 实现原理

VGG实现的原理图：不对将图片变薄变窄

1.3.2 VGG16与VGG19对比

1.3.3 VGG有两个很大的缺点

网络架构weight数量相当大，很消耗磁盘空间。
训练非常慢

由于其全连接节点的数量较多，再加上网络比较深，VGG16 有533MB+，VGG19有574MB。这使得部署VGG比较耗时。

Tensorflow入门与实战学习笔记（十一）-预训练网络_预训练网络_03

2 经典预训练网络权重分享和使用方法

这部分的学习主要是为了微调做服务的

微调

所谓微调：冻结模型库的底部的卷积层，共同训练新添加的分类器层和顶部部分卷积层。这允许我们“微调”基础模型中的高阶特征表示，以使它们与特定任务更相关。

只有分类器已经训练好了，才能微调卷积基的顶部卷积层。如果有没有这样的话，刚开始是随机的分类层，没有被训练，反向传播误差非常大，刚开始的训练误差很大，微调之前这些卷积层学到的表示会被破坏掉

微调步骤：

一、在预训练卷积基上添加自定义层

二、冻结卷积基所有层

三、训练添加的分类层

四、解冻卷积基的一部分层

五、联合训练解冻的卷积层和添加的自定义层、

2.1 、在预训练卷积基上添加自定义层

2.2、冻结卷积基所有层

2.3、训练添加的分类层

2.4、解冻卷积基的一部分层

2.5、联合训练解冻的卷积层和添加的自定义层、

结果分析

Tensorflow入门与实战学习笔记（十一）-预训练网络_预训练网络_10

3 常见的训练模型

3.1 可用的训练模型

3.2 模型介绍

3.3 Xception

# 就是不要分类器这个顶层
covn_base = keras.applications.xception.Xception(weights='imagenet',
                                                 include_top=False,
                                                 input_shape=(256,256,3),
                                                 pooling='avg')