第4章：函数式编程中的数据与工具

4.1 不可变数据结构

在函数式编程（FP）中，不可变数据结构（Immutable Data Structures）是实现不可变性原则的关键。它们确保数据一旦创建就无法修改，所有操作都返回新数据，而不是改变原有结构。这种设计不仅支持纯函数和并发编程，还为数据处理提供了可靠性和可预测性。本节将详细讲解不可变数据结构的定义、常见类型、操作方法及其在实践中的意义。

不可变数据结构的定义

不可变数据结构是指在内存中创建后，其内容无法被修改的数据类型。与常见的可变数据结构（如 Python 的 list 或 Java 的 ArrayList）不同，不可变数据结构不支持“就地更新”操作，而是通过生成新实例来反映变化。

核心特性：
- 不可修改：创建后无法更改内部元素。
- 复制更新：任何“修改”操作都返回新结构，原数据保持不变。
- 线程安全：无需锁即可在多线程中共享。

例如，Python 的元组（tuple）是不可变的：

numbers = (1, 2, 3)
# numbers[0] = 10  # 错误：元组不可修改
new_numbers = (10,) + numbers[1:]  # 输出: (10, 2, 3)
print(numbers)  # 输出: (1, 2, 3) 未变

常见的不可变数据类型

不可变数据结构在不同语言中有多种实现，常见类型包括：

列表（List）：
在函数式语言（如 Haskell）中，列表默认不可变，只能通过操作生成新列表。
```
-- Haskell 示例
numbers = [1, 2, 3]
newNumbers = 0 : numbers  -- 输出: [0, 1, 2, 3]
```

树（Tree）：
不可变树（如红黑树）常用于快速查找和插入。修改时返回新树，原树保持不变。

// Scala 示例
import scala.collection.immutable.TreeSet
val tree = TreeSet(1, 2, 3)
val newTree = tree + 4  // 输出: TreeSet(1, 2, 3, 4)
println(tree)  // 输出: TreeSet(1, 2, 3)

映射（Map）：
不可变映射存储键值对，更新时生成新映射。

# Python 使用 frozendict（需额外库）
from frozendict import frozendict
d = frozendict({'a': 1, 'b': 2})
new_d = frozendict({'a': 10, **d})  # 输出: {'a': 10, 'b': 2}
print(d)  # 输出: {'a': 1, 'b': 2}

集合（Set）：
不可变集合不支持直接添加或删除元素。

# Python 的 frozenset
s = frozenset([1, 2, 3])
new_s = frozenset([4]) | s  # 输出: frozenset({1, 2, 3, 4})
print(s)  # 输出: frozenset({1, 2, 3})

如何操作不可变数据

由于无法直接修改，不可变数据结构依赖函数式操作来处理：

添加元素：
返回包含新元素的新结构。

lst = (1, 2, 3)
new_lst = (0,) + lst  # 输出: (0, 1, 2, 3)

更新元素：
复制并替换指定位置的元素。

lst = (1, 2, 3)
new_lst = lst[:1] + (20,) + lst[2:]  # 输出: (1, 20, 3)

删除元素：
通过过滤生成新结构。

lst = (1, 2, 3)
new_lst = tuple(x for x in lst if x != 2)  # 输出: (1, 3)

这些操作与上一章的 map、filter 等技术结合，可以高效处理数据。

持久性数据结构

单纯复制不可变数据可能导致性能问题（如高内存使用）。为此，函数式编程引入了持久性数据结构（Persistent Data Structures），通过共享未变更部分的内存来优化效率：

原理：新旧结构共享不变部分，只复制被修改的部分。

示例：Clojure 的向量：

(def v1 [1 2 3])
(def v2 (conj v1 4))  ; 输出: [1 2 3 4]
;; v1 和 v2 共享 [1 2 3] 的内存

优势：在保持不可变性的同时，减少复制开销，常用于树、列表等复杂结构。

不可变数据结构的意义

并发编程：多线程可安全共享数据，无需同步。
调试与回溯：每次操作生成新数据，便于追踪历史状态。
函数式友好：支持纯函数，避免副作用。

例如，在 React 的状态管理中，不可变数据（如通过 Object.freeze 或库如 Immutable.js）确保了状态的可预测性：

const state = { count: 1 };
const newState = { ...state, count: 2 };  // 新对象
console.log(state);  // 输出: { count: 1 }

挑战与应对

性能开销：频繁创建新对象可能增加内存和垃圾回收压力。持久性数据结构是主要解决方案。
语言支持：Python 等语言默认数据结构多为可变，需借助库（如 immutables）或手动实现。
习惯调整：开发者需适应“复制而非修改”的思维。

小结

不可变数据结构是函数式编程实现不可变性的基石，它们通过复制更新和持久性优化，支持了安全、高效的数据处理。理解其操作方式和优势，能让你在并发和复杂系统中游刃有余。下一节，我们将探讨“模式匹配”，进一步丰富函数式编程的工具箱。