神经网络带batchsize的dataloader 神经网络 batchsize的选择

转载

mob64ca1417736e 2023-12-21 10:51:39

【1】Batch size

一般来说，在合理的范围之内，越大的 batch size 使下降方向越准确，震荡越小，这就好比决定往哪里走时参考了很多样本的意见，减少了小样本引入的随机性，但是越大的 batch size 也意味着训练时占用的显存更多。

【batch的选取类型】

Full Batch Learning：全数据集学习，通常用于数据集比较小的情况，每次训练时将所有数据都送入网络中进行学习，相当于 batch size = 训练集大小，这种方式能够保证梯度下降的方向代表了整个数据集的方向，但并不适用于目前的情况，因为现在的数据集都很大。

Online Learning：在线学习，是全数据集学习的另一个极端，每次只学习一个样本，即 batch size = 1，这样会学的很慢，而且每次只由一个单独的样本决定梯度的下降方向，引入了很大的随机性。

Mini-batches Learning：每次用少量的数据来计算梯度下降的方向，只要数据集足够充分，这样训练出来的梯度与全数据集学习的效果几乎是一样的。

【增大batch的好处】

【盲目增大batch的坏处】

【选取策略】

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客