第3章：神经网络核心

3.1 感知机与多层感知机

定义
感知机（Perceptron）是Frank Rosenblatt于1957年提出的二分类线性模型，是神经网络的最基本单元。其数学表达为：

f(x) = \begin{cases} 1 & \text{if } w \cdot x + b > 0 \\ 0 & \text{otherwise} \end{cases}

其中：

局限性
单层感知机仅能解决线性可分问题（如AND、OR逻辑），无法处理非线性问题（如XOR逻辑）。

结构
多层感知机通过堆叠多个感知机构成，包含：

数学表达
对于第( l )层的输出：

h^{(l)} = \sigma(W^{(l)} h^{(l-1)} + b^{(l)})

其中 ( \sigma ) 为激活函数。

万能近似定理
理论上，单隐藏层MLP在神经元足够多时可逼近任意连续函数（Cybenko, 1989）。

前向传播

示例代码（PyTorch）：

import torch.nn as nn
model = nn.Sequential(
    nn.Linear(input_dim, hidden_dim),
    nn.ReLU(),
    nn.Linear(hidden_dim, output_dim)
)


注：此内容包含理论公式、代码片段和对比表格，可根据需要增加更多实战案例或可视化示意图（如感知机决策边界图）。