哈希表基础

raw/articles/2026/05/哈希表基础

核心要点

1. 哈希表 vs Map

Map 是接口，仅声明操作方法（get/put/remove），未指定实现方式
HashMap 是 Map 的一种实现，底层使用哈希表，增删查改复杂度 O(1)
其他实现如 TreeMap（红黑树，O(logN)）、LinkedHashMap（保持插入顺序）
不能假设所有键值对操作都是 O(1)，需看具体实现的数据结构

2. 哈希表基本原理

哈希表 = 加强版数组
核心机制：通过哈希函数将 key 映射到数组索引，实现 O(1) 访问

伪码逻辑：

put(key, value): table[hash(key)] = value
get(key): return table[hash(key)]
remove(key): table[hash(key)] = null

3. 哈希函数设计

作用：将任意类型 key 转化为固定范围的非负整数索引
要求：
- 相同 key 必须产生相同哈希值（保证正确性）
- 计算复杂度必须为 O(1)（保证哈希表性能）

Java 实现示例：

int hash(K key) {
    int h = key.hashCode();  // 获取对象的哈希码
    h = h & 0x7fffffff;     // 位运算保证非负（避免取反溢出问题）
    return h % table.length; // 映射到合法索引
}

优化：标准库常用位运算替代 % 运算提升性能

4. 哈希冲突及解决方法

哈希冲突不可避免：将无限空间映射到有限索引空间，必然发生碰撞。

两种主流解决方法：

方法	原理	特点
拉链法	数组每个位置存储链表，冲突元素追加到链表	实现简单，负载因子可>1
线性探查法（开放寻址）	冲突时往后找空位（index+1, +2, ...）	缓存友好，负载因子≤1

5. 负载因子与扩容

负载因子 = size / table.length（已存键值对数 / 数组容量）
作用：度量哈希表的装满程度，越大则冲突概率越高
默认值：Java HashMap 默认 0.75（经验值）
扩容机制：达到负载因子时，扩大 table 数组容量，重新计算所有 key 的索引并搬移数据
影响：扩容过程耗时，但保证长期性能

6. 重要注意事项

问题	原因	建议
遍历顺序不确定	扩容后 key 的索引可能变化	不依赖遍历顺序编程
不能在 for 循环中增删 key	扩缩容导致 table 变化，行为不可预测	避免遍历时修改
key 必须是不可变类型	可变类型的 hashCode 会变，导致键值对"丢失"	用 String、Integer 等不可变类型

可变类型作为 key 的严重问题（以 ArrayList 为例）：

每次计算 hashCode 需遍历所有元素，复杂度 O(N)
修改元素后 hashCode 变化，原键值对无法被查到（"幽灵键值对"）
导致内存泄漏：键值对被 table 引用但无法访问

7. 为什么哈希表操作是 O(1)

前提是：哈希函数 O(1) + 合理解决哈希冲突
若哈希函数慢（如用可变类型作 key）或冲突严重未扩容，复杂度会退化

相关实体

labuladong：算法学习平台作者

Link to this note

index

Harness Engineering Wiki - 内容索引本页面由 Claude 自动维护，每次 ingest 新资料后更新📊 Stats总页面数: 151实体页: 2概念页: 81摘要页: 62对比页: 6最后更新: 2026-05-09📚 摘要页 (Summaries)| 页面链接

log

Harness Engineering - 操作日志本页面记录所有 Claude 的操作记录，仅追加，不修改历史记录[2026-05-02] init | 初始化仓库结构创建 raw/ 目录结构（articles, papers, images）创建 wiki/ 目录结构（entities, concepts, summaries, comparison）创建 wiki/index.md 索引页创建 wiki/log.md 操作日志仓库初始化完成[2026-05-02] ingest | 时间空间复杂度入门保存原始内容到 raw/articles/复杂度分析基础.md创建摘要页 wiki/summaries/2026-05-02 时间空间复杂度入门.md侧重：复杂度分析的实用方法（Big O 简化估算技巧）更新 wiki/index.md：摘要页数量 0→1注意：labuladong 实体和复杂度概念首次出现，暂不创建独立页（需 ≥2 篇来源）[2026-05-02] ingest | 数组基础（labuladong）提取网页内容（defuddle）并创建摘要页 wiki/summaries/2026-05-02 数组基础.md创建实体页

哈希表链地址法

type: summary tags: [哈希表, 拉链法, 链地址法, 数据结构, Java, 哈希冲突, 开放寻址法] created: 2026-05-03 updated: 2026-05-03哈希表链地址法（拉链法）实现[[raw/articles/2026/05/哈希表链地址法]]⚠️ 注意：原文使用 JavaScript 动态加载内容，未能获取完整正文（仅获取到29行简介）。以下为基于现有内容的摘要，待补充完整内容。核心要点前置知识本文建立于以下基础知识之上：[[哈希表基础]][[链表]]哈希冲突解决方法回顾文章回顾了两种主流哈希冲突解决方法：| 方法 | 别名 | 原理 | |------|------|------| | 拉链法 | 链地址法 | 数组每个位置存储链表，冲突元素追加到链表 | | 开放寻址法 | 线性探查法 | 冲突时往后找空位（index+1, +2, ...） |![[images/hash-collision.jpeg]]拉链法简化版实现假设为了便于理解，文章采用以下简化：类型限制：仅支持 key 类型为 int，value 类型为 int，key 不存在时返回

线性探查法的两个难点

type: summary tags: [哈希表, 线性探查法, 开放寻址法, 数据结构, 算法原理, 哈希冲突] created: 2026-05-03 updated: 2026-05-03线性探查法的两个难点[[raw/articles/2026/05/线性探查法的两个难点]]⚠️ 注意：原文使用 JavaScript 动态加载内容，未能获取完整正文（仅获取到"简化场景"部分，缺少"两个难点"的核心内容）。以下为基于现有内容的摘要，待补充完整内容。核心要点（侧重算法原理理解）前置知识本文建立于以下基础知识之上：[[哈希表基础]]哈希冲突解决方法对比| 方法 | 别名 | 基本原理 | 特点 | |------|------|---------|------| | 拉链法 | 链地址法 | 数组每个位置存储链表，冲突元素追加到链表 | 实现简单，每个桶独立 | | 线性探查法 | 开放寻址法 | 冲突时往后找空位（index+1, +2, ...） | 所有元素存在数组中，缓存友好 |![[images/hash-collision.jpeg]]线性探查法基本原理核心思想：当发生哈希冲突时，从冲突位置开始，线性向后探查，直到找到：相同的 key（更新值）空位（插入新键值对）到达数组末尾（探查失败，需特殊处理）算法特性：所有数据存储在同一个数组中（不像拉链法需要额外链表）探查序列：hash(key),