我是卷积神经网络的新手,只是对特征映射和如何对图像进行卷积来提取特征有一些想法。我很高兴知道一些细节,关于应用批量正常化在 CNN。
我读了这篇论文 https://arxiv.org/pdf/1502.03167v3.pdf,可以理解 BN 算法应用于一个数据,但最后他们提到,一个轻微的修改时,需要应用到 CNN:
对于卷积图层,我们还希望规范化服从卷积属性——这样同一特征映射的不同元素,在不同的位置,以相同的方式进行规范化。为了实现这一点,我们联合规范化一个小批处理中的所有激活,遍布所有位置。在 Alg。1,我们让 B 是跨越小批量和空间位置的元素的特征映射中的所有值的集合-因此对于 m 的小批量和 p × q 的特征映射,我们使用 m ′ = | B | = m · pq 的有效小批量。我们每个特征映射学习一对参数 γ (k)和 β (k) ,而不是每个激活。Alg.这样,在推理过程中,BN 变换对给定特征映射中的每个激活应用相同的线性映射。
当他们说 使同一特征映射的不同元素,在不同的位置,以同样的方式归一化
我知道特征映射是什么意思,不同的元素是每个特征映射的权重。但是我不能理解位置或者空间位置是什么意思。
我完全听不懂下面这句话 在 Alg。1,我们让 B 成为一个特征映射中的所有值的集合,这个特征映射跨越了一个小批量和空间位置的元素
如果有人能用更简单的术语来详细解释我,我会很高兴的