文章目录

  • ​​1 Epoch​​
  • ​​2 Batch Size​​
  • ​​3 Iteration​​
  • ​​4 示例​​
  • ​​5 参考文献​​

在神经网络训练中,有三个概念:Epoch、Batch Size、Iteration。下面对三者的概念与区别进行介绍。


1 Epoch

Epoch,一次完整训练,即"一代训练"。当一个完整的数据集通过了神经网络一次并且返回了一次,这个过程称为一个Epoch。

需要将完整的数据集在同样的神经网络中传递多次,仅仅更新权重一次或者说使用一个Epoch是不够的,选择合适的Epoch的数量取决于数据的多样性等因素。

在不能将数据一次性通过神经网络的时候,就需要将数据集分成几个Batch,见【2 Batch Size】一节。


2 Batch Size

Batch Size,批量大小,即一次训练所选取的样本数。由于在数据很庞大的时候,一次性将数据输入计算机是不可能的,可以把数据分成小块,一块一块的传递给计算机。在小样本数的数据库中,不使用Batch Size是可行的,而且效果也很好。但是一旦是大型的数据库,一次性把所有数据输进网络,肯定会引起内存的爆炸。所以就提出Batch Size的概念。


3 Iteration

Iteration,算法是迭代的,意思是需要多次使用算法获取结果,以得到最优化结果。迭代是将数据分块后需要完成一个Epoch的次数,即完整的数据集通过了神经网络一次并且返回了一次所需的次数。

在一个Epoch中,Batch数和迭代数是相等的。Batch数是将数据被分成批次的数量,需要与批量大小即Batch Size区分开。


4 示例

比如对于一个有2000个训练样本的数据集,将2000个样本分成大小为500的Batch。那么:

  • 完成一个Epoch需要4个Iteration。
  • Batch数也为4。
  • Batch Size为500。

5 参考文献

1、​​神经网络训练中,傻傻分不清Epoch、Batch Size和迭代​

2、​​神经网络中Batch Size的理解​​


END