第4章：卷积神经网络（CNN）

CNN的架构设计

1. 核心组件与设计原则

卷积神经网络（CNN）的架构设计遵循层次化特征提取的思想，通常包含以下核心组件：

输入层：接收原始图像或数据（需标准化处理）
卷积层堆叠：通过多个卷积核提取局部特征（浅层提取边缘/纹理，深层提取语义特征）
池化层：降低空间维度（常用最大池化保留显著特征）
全连接层：最终分类/回归（现代架构倾向用全局平均池化替代）

设计原则：

感受野递增：浅层小卷积核（3×3），深层可增大感受野
特征图通道变化：随网络深度增加通道数（如ResNet的bottleneck设计）
残差连接：解决梯度消失问题（ResNet的核心创新）

2. 典型架构模式

(1) 顺序堆叠式

# 示例：VGG风格的顺序结构
Conv2D(64, 3×3, ReLU) → Conv2D(64, 3×3, ReLU) → MaxPool(2×2)
Conv2D(128, 3×3, ReLU) → Conv2D(128, 3×3, ReLU) → MaxPool(2×2)
...

(2) 残差连接式

# ResNet的残差块（Identity Mapping）
input → Conv1 → BN → ReLU → Conv2 → BN → +input → ReLU

(3) 多分支结构

Inception模块：并行不同尺寸卷积核（1×1, 3×3, 5×5）
DenseNet：每层输出连接到后续所有层

3. 现代优化技巧

技术	作用	示例实现
深度可分离卷积	减少参数量	`SeparableConv2D`
注意力机制	增强重要特征响应	SE模块、CBAM
分组卷积	提升并行效率（如ResNeXt）	`groups=32`

4. 架构设计实践建议

轻量化设计：
- 使用MobileNet的倒残差结构
- 引入通道剪枝（Channel Pruning）
自动化设计：
- 神经架构搜索（NAS）框架
- 进化算法生成最优结构
领域适配：
- 医学影像：3D卷积+各向异性池化
- 视频处理：时空卷积（3D CNN或2D+RNN混合）

经典论文参考：
《Very Deep Convolutional Networks for Large-Scale Image Recognition》（VGG）
《Deep Residual Learning for Image Recognition》（ResNet）
《Attention Is All You Need》（ViT中的CNN思想延伸）

5. 可视化理解

CNN架构演变
（示意图：从LeNet到EfficientNet的架构复杂度变化）


注：实际使用时需补充以下内容：
1. 替换示例代码为具体框架实现（PyTorch/TensorFlow）
2. 添加真实案例的架构图（如ResNet-34结构图）
3. 插入性能对比表格（参数量/计算量/准确率）
4. 扩展实际部署时的架构调整策略（如量化友好设计）