Tailwind CSSTailwind CSS
Home
  • Tailwind CSS 书籍目录
  • Vue 3 开发实战指南
  • React 和 Next.js 学习
  • TypeScript
  • React开发框架书籍大纲
  • Shadcn学习大纲
  • Swift 编程语言:从入门到进阶
  • SwiftUI 学习指南
  • 函数式编程大纲
  • Swift 异步编程语言
  • Swift 协议化编程
  • SwiftUI MVVM 开发模式
  • SwiftUI 图表开发书籍
  • SwiftData
  • ArkTS编程语言:从入门到精通
  • 仓颉编程语言:从入门到精通
  • 鸿蒙手机客户端开发实战
  • WPF书籍
  • C#开发书籍
learn
  • Java编程语言
  • Kotlin 编程入门与实战
  • /python/outline.html
  • AI Agent
  • MCP (Model Context Protocol) 应用指南
  • 深度学习
  • 深度学习
  • 强化学习: 理论与实践
  • 扩散模型书籍
  • Agentic AI for Everyone
langchain
Home
  • Tailwind CSS 书籍目录
  • Vue 3 开发实战指南
  • React 和 Next.js 学习
  • TypeScript
  • React开发框架书籍大纲
  • Shadcn学习大纲
  • Swift 编程语言:从入门到进阶
  • SwiftUI 学习指南
  • 函数式编程大纲
  • Swift 异步编程语言
  • Swift 协议化编程
  • SwiftUI MVVM 开发模式
  • SwiftUI 图表开发书籍
  • SwiftData
  • ArkTS编程语言:从入门到精通
  • 仓颉编程语言:从入门到精通
  • 鸿蒙手机客户端开发实战
  • WPF书籍
  • C#开发书籍
learn
  • Java编程语言
  • Kotlin 编程入门与实战
  • /python/outline.html
  • AI Agent
  • MCP (Model Context Protocol) 应用指南
  • 深度学习
  • 深度学习
  • 强化学习: 理论与实践
  • 扩散模型书籍
  • Agentic AI for Everyone
langchain
  • 第2章:数学与计算基础

第2章:数学与计算基础

线性代数入门

1. 标量、向量与矩阵

  • 标量(Scalar):单个数值(如温度、质量),是零维张量。
  • 向量(Vector):一维有序数组(如坐标点、特征向量),表示为 v=[v1,v2,…,vn]\mathbf{v} = [v_1, v_2, \dots, v_n]v=[v1​,v2​,…,vn​]。
  • 矩阵(Matrix):二维数组(如灰度图像、权重矩阵),表示为 A∈Rm×n\mathbf{A} \in \mathbb{R}^{m \times n}A∈Rm×n。

示例:
图像数据可表示为三维张量(高度×宽度×通道数)。

2. 基本运算

向量运算

  • 加法:对应元素相加,u+v=[u1+v1,…,un+vn]\mathbf{u} + \mathbf{v} = [u_1+v_1, \dots, u_n+v_n]u+v=[u1​+v1​,…,un​+vn​]。
  • 点积:u⋅v=∑i=1nuivi\mathbf{u} \cdot \mathbf{v} = \sum_{i=1}^n u_i v_iu⋅v=∑i=1n​ui​vi​,用于衡量相似性。

矩阵运算

  • 矩阵乘法:若 A∈Rm×n\mathbf{A} \in \mathbb{R}^{m \times n}A∈Rm×n,B∈Rn×p\mathbf{B} \in \mathbb{R}^{n \times p}B∈Rn×p,则乘积 C=AB\mathbf{C} = \mathbf{AB}C=AB 满足 Cij=∑k=1nAikBkjC_{ij} = \sum_{k=1}^n A_{ik} B_{kj}Cij​=∑k=1n​Aik​Bkj​。
  • 哈达玛积(Hadamard Product):逐元素相乘,A⊙B\mathbf{A} \odot \mathbf{B}A⊙B。

3. 特殊矩阵与性质

类型定义应用场景
单位矩阵 I\mathbf{I}I对角元素为1,其余为0权重初始化、矩阵求逆
对称矩阵A=AT\mathbf{A} = \mathbf{A}^TA=AT协方差矩阵、Hessian矩阵
正交矩阵ATA=I\mathbf{A}^T\mathbf{A} = \mathbf{I}ATA=I特征分解、降维

4. 特征分解与奇异值分解(SVD)

  • 特征分解:将方阵 A\mathbf{A}A 分解为 A=QΛQ−1\mathbf{A} = \mathbf{Q} \mathbf{\Lambda} \mathbf{Q}^{-1}A=QΛQ−1,其中 Λ\mathbf{\Lambda}Λ 为特征值对角矩阵。
  • SVD:任意矩阵 A\mathbf{A}A 可分解为 A=UΣVT\mathbf{A} = \mathbf{U} \mathbf{\Sigma} \mathbf{V}^TA=UΣVT,用于主成分分析(PCA)和推荐系统。

5. 张量基础

  • 定义:多维数组(如RGB图像为3维张量)。
  • 操作:重塑(reshape)、转置(transpose)、广播(broadcasting)。

代码示例(Python)

import numpy as np

# 向量与矩阵运算
v = np.array([1, 2, 3])
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])

print("矩阵乘法:", A @ B)  # 或 np.dot(A, B)
print("哈达玛积:", A * B)

关键公式

  • 矩阵乘法:(AB)ij=∑kAikBkj(AB)_{ij} = \sum_{k} A_{ik} B_{kj}(AB)ij​=∑k​Aik​Bkj​
  • L2范数:∥v∥2=∑ivi2\|\mathbf{v}\|_2 = \sqrt{\sum_i v_i^2}∥v∥2​=∑i​vi2​​

提示:深度学习中的梯度计算、权重更新均依赖线性代数运算,建议熟练掌握矩阵微分规则。

Last Updated:: 6/17/25, 10:13 AM