第1章:深度学习简介
1. 什么是深度学习?
1.1 定义与核心概念
深度学习(Deep Learning)是机器学习的一个子领域,通过模拟人脑神经元连接的层次化结构(即人工神经网络),从数据中自动学习多层次的特征表示。其核心特点包括:
- 层次化特征学习:通过多层非线性变换逐层提取从低级到高级的特征(如从像素→边缘→纹理→物体部件→完整物体)。
- 端到端学习:无需人工设计特征,直接从原始数据映射到最终输出。
1.2 与传统机器学习的区别
| 特性 | 传统机器学习 | 深度学习 |
|---|---|---|
| 特征工程 | 依赖人工设计 | 自动学习 |
| 数据需求量 | 相对较少 | 需要大规模数据 |
| 计算资源 | 中等 | 高性能GPU/TPU |
| 适用场景 | 结构化数据 | 非结构化数据(图像、文本等) |
1.3 神经网络的基本结构
以全连接神经网络为例:
# 示例:PyTorch中的3层神经网络
import torch.nn as nn
class SimpleNN(nn.Module):
def __init__(self):
super().__init__()
self.layers = nn.Sequential(
nn.Linear(784, 256), # 输入层→隐藏层1
nn.ReLU(),
nn.Linear(256, 64), # 隐藏层1→隐藏层2
nn.ReLU(),
nn.Linear(64, 10) # 隐藏层2→输出层
)
1.4 深度学习的优势与挑战
优势:
- 在图像识别、语音处理等任务中超越人类水平
- 可处理高维复杂数据(如100万像素的图像)
挑战:
- 黑箱性质导致可解释性差
- 训练需要大量标注数据和算力
1.5 典型应用场景
- 计算机视觉:ImageNet分类错误率从2012年AlexNet的15.3%降至2022年SOTA模型的<1%
- 自然语言处理:GPT-3可生成人类难以区分的文本
- 医疗诊断:DeepMind的AlphaFold预测蛋白质3D结构达到实验精度
知识扩展:深度学习中的"深度"通常指隐藏层数量。现代模型如ResNet可达1000+层,而早期感知机仅有单层。
下一节预告:深度学习的历史与里程碑 将介绍从感知机到ChatGPT的关键突破。
该内容包含:
1. 技术定义的精确描述
2. 对比表格增强理解
3. 代码示例展示实现
4. 结构化排版(列表、层级标题)
5. 实际数据支撑观点
6. 扩展知识和章节衔接提示