【AutoML】如何使用强化学习进行模型剪枝？

原创

言有三 2022-10-12 17:38:45 ©著作权

©著作权归作者所有：来自51CTO博客作者言有三的原创作品，请联系作者获取转载授权，否则将追究法律责任

大家好，欢迎来到专栏《AutoML》，在这个专栏中我们会讲述AutoML技术在深度学习中的应用，这一期讲述在模型剪枝中的应用。

作者&编辑 | 言有三

我们往期的文章中介绍了各种各样的模型压缩技巧，那么是否也可以使用AutoML技术来用于模型压缩，比如剪枝呢。

1 AMC

AutoML for Model Compression(AMC)是一个利用强化学习自动搜索并提高模型剪枝算法质量的框架，其完整的流程如下：

【AutoML】如何使用强化学习进行模型剪枝？_ide

在一般的剪枝算法中，我们通常遵循一些基本策略：比如在提取低级特征的参数较少的第一层中剪掉更少的参数，对冗余性更高的FC层剪掉更多的参数。然而，由于深度神经网络中的层不是孤立的，这些基于规则的剪枝策略并不是最优的，也不能从一个模型迁移到另一个模型。

AMC方法便是在该背景下，利用强化学习自动搜索并提高模型压缩的质量，该框架是每一层进行独立压缩，前一层压缩完之后再往后层进行传播，t层接受该层的输入特征s_t，输出稀疏比率a_t，按照a_t对该层进行压缩后，智能体移动到下一层L_t+1，使用验证集精度作为评估，伪代码如下：

【AutoML】如何使用强化学习进行模型剪枝？_ide_02

作者们对两类场景进行了实验，第一类是受延迟影响较大的应用如移动APP，使用的是资源受限的压缩，这样就可以在满足低FLOP和延迟，小模型的情况下实现最好的准确率；这一类场景作者通过限制搜索空间来实现，在搜索空间中，动作空间（剪枝率）受到限制，使得被智能体压缩的模型总是低于资源预算。

另一类是追求精度的应用如Google Photos，就需要在保证准确率的情况下压缩得到更小的模型。对于这一类场景，作者定义了一个奖励，它是准确率和硬件资源的函数。基于这个奖励函数，智能体在不损害模型准确率的前提下探索压缩极限。

每一层的状态空间为(t, n, c, h, w, stride, k, FLOP s[t], reduced, rest, at−1)，t是层指数，输入维度是n×c×k×k，输入大小是c×h×w，reduces就是前一层减掉的flops，rest是剩下的flops。

因为剪枝对通道数特别敏感，所以这里不再是使用离散的空间，如{128,256}，而是使用连续的空间，使用deep deterministic policy gradient (DDPG)来控制压缩比率，完整的算法流程如下：

【AutoML】如何使用强化学习进行模型剪枝？_搜索_03

对于细粒度的剪枝，可以使用权重的最小幅度作为阈值，对于通道级别的压缩，可以使用最大响应值。

在谷歌Pixel-1 CPU和MobileNet模型上，AMC实现了1.95 倍的加速，批大小为1，节省了34%的内存。在英伟达Titan XP GPU 上，AMC实现了1.53 倍的加速，批大小为50。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯