Tailwind CSSTailwind CSS
Home
  • Tailwind CSS 书籍目录
  • Vue 3 开发实战指南
  • React 和 Next.js 学习
  • TypeScript
  • React开发框架书籍大纲
  • Shadcn学习大纲
  • Swift 编程语言:从入门到进阶
  • SwiftUI 学习指南
  • 函数式编程大纲
  • Swift 异步编程语言
  • Swift 协议化编程
  • SwiftUI MVVM 开发模式
  • SwiftUI 图表开发书籍
  • SwiftData
  • ArkTS编程语言:从入门到精通
  • 仓颉编程语言:从入门到精通
  • 鸿蒙手机客户端开发实战
  • WPF书籍
  • C#开发书籍
learn
  • Java编程语言
  • Kotlin 编程入门与实战
  • /python/outline.html
  • AI Agent
  • MCP (Model Context Protocol) 应用指南
  • 深度学习
  • 深度学习
  • 强化学习: 理论与实践
  • 扩散模型书籍
  • Agentic AI for Everyone
langchain
Home
  • Tailwind CSS 书籍目录
  • Vue 3 开发实战指南
  • React 和 Next.js 学习
  • TypeScript
  • React开发框架书籍大纲
  • Shadcn学习大纲
  • Swift 编程语言:从入门到进阶
  • SwiftUI 学习指南
  • 函数式编程大纲
  • Swift 异步编程语言
  • Swift 协议化编程
  • SwiftUI MVVM 开发模式
  • SwiftUI 图表开发书籍
  • SwiftData
  • ArkTS编程语言:从入门到精通
  • 仓颉编程语言:从入门到精通
  • 鸿蒙手机客户端开发实战
  • WPF书籍
  • C#开发书籍
learn
  • Java编程语言
  • Kotlin 编程入门与实战
  • /python/outline.html
  • AI Agent
  • MCP (Model Context Protocol) 应用指南
  • 深度学习
  • 深度学习
  • 强化学习: 理论与实践
  • 扩散模型书籍
  • Agentic AI for Everyone
langchain
  • 概率与统计基础

概率与统计基础

1. 概率论基础概念

1.1 随机变量与概率分布

  • 随机变量:描述随机现象的数学对象(离散型/连续型)
  • 常见分布:
    • 离散:伯努利分布、二项分布、泊松分布
    • 连续:均匀分布、正态分布(高斯分布)、指数分布

1.2 条件概率与贝叶斯定理

  • 条件概率公式:P(A∣B)=P(A∩B)P(B)P(A|B) = \frac{P(A \cap B)}{P(B)}P(A∣B)=P(B)P(A∩B)​
  • 贝叶斯定理:P(A∣B)=P(B∣A)P(A)P(B)P(A|B) = \frac{P(B|A)P(A)}{P(B)}P(A∣B)=P(B)P(B∣A)P(A)​

2. 统计量及其意义

2.1 描述性统计

统计量计算公式意义
均值(μ)1n∑xi\frac{1}{n}\sum x_in1​∑xi​数据集中趋势
方差(σ²)1n∑(xi−μ)2\frac{1}{n}\sum(x_i-μ)^2n1​∑(xi​−μ)2数据离散程度
协方差Cov(X,Y)=E[(X−μX)(Y−μY)]\text{Cov}(X,Y)=E[(X-μ_X)(Y-μ_Y)]Cov(X,Y)=E[(X−μX​)(Y−μY​)]变量线性相关性

2.2 最大似然估计(MLE)

  • 核心思想:选择使观测数据出现概率最大的参数
  • 对数似然函数:L(θ)=log⁡P(X∣θ)\mathcal{L}(θ) = \log P(X|θ)L(θ)=logP(X∣θ)

3. 深度学习中的关键概率概念

3.1 信息论基础

  • 熵:H(X)=−∑p(x)log⁡p(x)H(X) = -\sum p(x)\log p(x)H(X)=−∑p(x)logp(x)
  • KL散度:衡量两个分布的差异
  • 交叉熵:常用作分类任务的损失函数

3.2 蒙特卡洛方法

  • 通过随机采样近似计算复杂积分/期望
  • 在强化学习(策略评估)和贝叶斯推断中广泛应用

4. 统计假设检验

4.1 常用检验方法

  • t检验(均值差异)
  • χ²检验(分布拟合)
  • F检验(方差分析)

4.2 p值与置信区间

  • p值<0.05通常认为统计显著
  • 95%置信区间的正确解读

5. 实战应用示例

# 正态分布采样与可视化
import numpy as np
import matplotlib.pyplot as plt

mu, sigma = 0, 0.1
s = np.random.normal(mu, sigma, 1000)
plt.hist(s, bins=30, density=True)
plt.show()

关键公式速查表

概念公式
正态分布PDF12πσ2e−(x−μ)22σ2\frac{1}{\sqrt{2πσ^2}}e^{-\frac{(x-μ)^2}{2σ^2}}2πσ2​1​e−2σ2(x−μ)2​
伯努利分布pk(1−p)1−kp^k(1-p)^{1-k}pk(1−p)1−k
交叉熵损失−∑yilog⁡(pi)-\sum y_i \log(p_i)−∑yi​log(pi​)

深度学习关联提示:概率统计是理解以下内容的基础:

  • 损失函数的概率解释(如交叉熵)
  • 贝叶斯神经网络
  • Dropout的正则化概率视角 变分自编码器(VAE)中的变分推断
Last Updated:: 6/17/25, 10:13 AM