卷积神经网络

卷积神经网络#

与全连接网络类似，卷积神经网络也由多个层组成。其核心思想是：

在分类任务（如 MNIST 手写数字识别）中，网络末端通常采用全连接层，将卷积输出的特征映射到类别数量上，以实现最终分类。

典型的卷积神经网络由以下三类层组成：

下图展示了经典卷积神经网络的架构示意：

卷积神经网络架构

如前所述，单层卷积仅实现像素的局部交互。例如，采用 \(3 \times 3\) 的滤波器时，每个像素仅受其邻域像素影响。这种局部性限制了网络检测全局图像特征（如覆盖整个图像的模式）的能力。

然而，堆叠多层卷积可逐步扩大单个像素的影响范围（即感受野）。下图直观展示了这一原理：

感受野演变

图片来源：博文链接

感受野可通过以下公式形式化计算：

\[R_{Eff} = R_{Init} + (k - 1) \times S\]

其中：

在设计卷积网络时，必须验证感受野是否足够覆盖关键像素交互。原则上：

注：之前介绍的模型优化工具（如批归一化 BatchNorm 和 Dropout）同样适用于卷积神经网络，可进一步提升其性能。

为理解卷积网络的工作机制及各层功能，可视化不同深度的特征图（FeatureMaps）激活是行之有效的方法。下图展示了随网络深度变化的特征图：

各层特征图

由图可知：