神经网络修剪法神经网络简化

关注 mob6454cc747bda

神经网络修剪法神经网络简化

转载

mob6454cc747bda 2023-11-06 21:30:14

文章标签 神经网络修剪法神经网络中科院权值浮点型 文章分类 神经网络人工智能

三值神经网络：

本文是对中科院两位科研工作者的文章的理解翻译：

就目前而言，深度神经网络的层数和训练时间变得越来越多。一方面，人们想要在处理器上面下功夫，但是处理器的处理速度也十分有限。造成目前一个比较深的神经网络的训练时间有时候往往需要一到两周，基于目前的困难，就有人提出了解决方式。

首先，在神经网络训练的整个训练过程中，最占用时间的无疑是乘法操作。是浮点型数据的乘法尤其消耗计算量，往往需要很多个Clock。那么，如果把所有全连接的权值全部变成1，或者-1的话，乘法运算就变成了简单的加减法，这无疑是非常节约计算时间的。目前的权值简化策略大概分为两种，Binary和Ternary。Binary是把权值简化为1和-1，而Ternary是把权值简化为1，-1,0两者的区别是什么呢？Binary在比较简单的库表现比较好比如说MNIST, CIFAR-10，但是在比较复杂的库比如说ImageNet上表现相对于Ternary有差距。

其次，讲一下三值神经网络的具体的实现，算法见下图：

神经网络修剪法神经网络简化_浮点型

这个算法的核心是只在前向和后向过程中使用使用权值简化，但是在update是仍然是使用连续的权值。

简单的说就是先利用公式计算出三值网络中的阈值：

神经网络修剪法神经网络简化_神经网络修剪法_02

也就是说，将每一层的权值绝对值求平均值乘以0.7算出一个deta作为三值网络离散权值的阈值，具体的离散过程如下：

神经网络修剪法神经网络简化_中科院_03

alpha参数，具体干什么用后面会说：这个参数的计算方式如下：

神经网络修剪法神经网络简化_中科院_04

|I(deta)|这个参数指的是权值的绝对值大于deta的权值个数，计算出这个参数我们就可以简化前向计算了，具体简化过程如下：

神经网络修剪法神经网络简化_神经网络修剪法_05

神经网络修剪法神经网络简化_浮点型_06

可以看到，在把alpha乘到前面以后，我们把复杂的乘法运算变成了简单的加法运算，从而加快了整个的训练速度。下面我们可以看看我们做得三值神经网络的效果如何：

神经网络修剪法神经网络简化_神经网络修剪法_07

可以看到，其实三值网络在ImageNet这种库上面，虽然效果好于二值网络但是还是不够准确，实际的工作中我们可以考虑在准确率到达一定程度后，再去使用简化权值网络达到加快训练时间同时保护识别精度的效果。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：android task任务 task安卓

下一篇：scheduler在神经网络中什么意思 scheduling

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册