第3章：神经网络核心

训练神经网络之正则化技术

正则化（Regularization）是防止机器学习模型过拟合（Overfitting）的核心技术之一。其核心思想是通过在损失函数中引入额外的约束项，限制模型参数的复杂度，从而提高模型在测试数据上的泛化能力。

关键目标：

类型	数学形式	特性
L1正则化	$\lambda \sum\|w\|$	产生稀疏权重矩阵（特征选择）
L2正则化	$\lambda \sum w^2$	使权重平滑衰减（更小的绝对值）

代码示例（PyTorch实现）：

# L2正则化（权重衰减）
optimizer = torch.optim.SGD(model.parameters(), lr=0.01, weight_decay=1e-5)

实现要点：

torch.nn.Dropout(p=0.5)  # 通常在全连接层后使用

诊断方法：

典型实验对比：

方法	训练准确率	测试准确率	过拟合程度
无正则化	98%	82%	严重
L2+Dropout	95%	88%	中等
综合方案	93%	90%	轻微

扩展阅读：最新的研究显示，Batch Normalization本身也具有正则化效果，可与传统方法配合使用（参见第3章第6节）。


该内容包含理论解释、实现方法和实践指导，符合专业书籍的技术深度要求。如需增加具体案例或数学推导细节，可进一步扩展。