卷积层

CNN 最重要的组成部分是卷积层：第一卷积层中的神经元不是连接到输入图像中的每一个像素（就像它们在前面的章节中那样），而是仅仅连接到它们的局部感受野中的像素（参见图 13-2）。进而，第二卷积层中的每个神经元只与位于第一层中的小矩形内的神经元连接。这种架构允许网络专注于第一隐藏层中的低级特征，然后将其组装成下一隐藏层中的高级特征，等等。这种层次结构在现实世界的图像中是很常见的，这也是 CNN 在图像识别方面效果很好的原因之一。

卷积层 - 图1

到目前为止，我们所看到的所有多层神经网络都有由一长串神经元组成的层，在输入到神经网络之前我们必须将输入图像压缩成 1D。现在，每个图层都以 2D 表示，这使得神经元与其相应的输入进行匹配变得更加容易。

位于给定层的第i行第j列的神经元连接到位于前一层中的神经元的输出的第i行到第卷积层 - 图2 行，第j列到第卷积层 - 图3 列。fh和fw是局部感受野的高度和宽度（见图 13-3）。为了使图层具有与前一图层相同的高度和宽度，通常在输入周围添加零，如图所示。这被称为零填充.

卷积层 - 图4

如图 13-4 所示，通过将局部感受野隔开，还可以将较大的输入层连接到更小的层。两个连续的感受野之间的距离被称为步幅。在图中，一个5×7的输入层（加零填充）连接到一个3×4层，使用3×3的卷积核和一个步幅为 2（在这个例子中，步幅在两个方向是相同的，但是它并不一定总是如此）。位于上层第i行第j列的神经元与位于前一层中的神经元的输出连接的第卷积层 - 图5 至卷积层 - 图6 行，第卷积层 - 图7 列， Sh和Sw是垂直和水平的步幅。

卷积层 - 图8