动机:实际训练时,由于batch都很小,因此每次BN的效果并没这么好。希望BN时能解决这个batch_size的影响。​​