第5章：循环神经网络（RNN）

RNN的基本原理

循环神经网络（Recurrent Neural Network, RNN）是一类专门用于处理序列数据的神经网络。与传统的前馈神经网络不同，RNN通过引入时间维度上的循环连接，使网络能够保留历史信息并影响当前输出。其核心特点是：

# 伪代码表示RNN计算过程
h_t = activation(W_hh * h_{t-1} + W_xh * x_t + b_h)
y_t = W_hy * h_t + b_y

时间步1: x1 → h1 → y1
           ↓    ↗
时间步2: x2 → h2 → y2
           ↓    ↗
时间步3: x3 → h3 → y3

对于时间步 $t$ ：

\begin{aligned} h_t &= \sigma(W_{hh}h_{t-1} + W_{xh}x_t + b_h) \\ y_t &= W_{hy}h_t + b_y \end{aligned}

其中 $\sigma$ 通常为tanh或ReLU激活函数

关键理解：RNN的本质是通过循环连接赋予网络"记忆"能力，使其能够处理任意长度的序列数据，同时保持模型参数规模不变。


如果需要补充具体示例或更详细的数学推导部分，可以进一步扩展相关内容。