线性探查法的两个难点

raw/articles/2026/05/线性探查法的两个难点

⚠️ 注意：原文使用 JavaScript 动态加载内容，未能获取完整正文（仅获取到"简化场景"部分，缺少"两个难点"的核心内容）。以下为基于现有内容的摘要，待补充完整内容。

核心要点（侧重算法原理理解）

前置知识

本文建立于以下基础知识之上：

哈希表基础

哈希冲突解决方法对比

方法	别名	基本原理	特点
拉链法	链地址法	数组每个位置存储链表，冲突元素追加到链表	实现简单，每个桶独立
线性探查法	开放寻址法	冲突时往后找空位（index+1, +2, ...）	所有元素存在数组中，缓存友好

images/hash-collision.jpeg

线性探查法基本原理

核心思想：当发生哈希冲突时，从冲突位置开始，线性向后探查，直到找到：

相同的 key（更新值）
空位（插入新键值对）
到达数组末尾（探查失败，需特殊处理）

算法特性：

所有数据存储在同一个数组中（不像拉链法需要额外链表）
探查序列：hash(key), hash(key)+1, hash(key)+2, ...
探查窗口：从初始哈希值到找到空位之间的连续区域

简化场景伪代码分析

文章给出了一个简化场景来理解线性探查法：

// 简化假设：
// - key 和 value 都是 int 类型
// - table 长度固定为 10
// - hash 函数：hash(key) = key % 10

class MyLinearProbingHashMap {
    private KVNode[] table = new KVNode[10];

    private int hash(int key) {
        return key % table.length;
    }

    public void put(int key, int value) {
        int index = hash(key);
        KVNode node = table[index];
        if (node == null) {
            // 情况1：直接命中空位
            table[index] = new KVNode(key, value);
        } else {
            // 情况2：冲突，向后线性探查
            while (index < table.length
                   && table[index] != null
                   && table[index].key != key) {
                index++;
            }
            // 找到空位或相同 key，插入/更新
            table[index] = new KVNode(key, value);
        }
    }

    public int get(int key) {
        int index = hash(key);
        // 向后探查，直到找到 key 或者找到空位
        while (index < table.length
               && table[index] != null
               && table[index].key != key) {
            index++;
        }
        if (table[index] == null) {
            return -1;  // 未找到
        }
        return table[index].value;
    }

    public void remove(int key) {
        int index = hash(key);
        // 向后探查，直到找到 key 或者找到空位
        while (index < table.length
               && table[index] != null
               && table[index].key != key) {
            index++;
        }
        // 删除 table[index]
        // ...（这里涉及难点，见下文）
    }
}

线性探查法的两个难点（待补充完整内容）

根据文章标题，线性探查法实现有两个主要难点：

推测难点（基于算法原理和伪代码分析）：

删除操作的复杂性：
- 不能直接置为 null（会破坏探查链）
- 如果删除中间位置的元素，后续元素的查找会失败（因为遇到空位就停止探查）
- 可能需要特殊标记（如 deleted 标记）或重新插入后续元素
探查序列的管理：
- 如何处理数组末尾循环回开头（环形缓冲区）
- 如何检测表已满（避免无限循环）
- 负载因子控制与扩容时机

待确认：文章实际内容会详细讲解这两个难点的具体表现和解决方案。

与拉链法的核心区别

维度	拉链法	线性探查法
存储方式	数组 + 链表	纯数组
冲突处理	同一桶内链表存储	向后找空位
缓存友好性	较差（指针跳转）	较好（连续内存）
删除操作	简单（链表删除）	复杂（需保持探查链）
负载因子	可以 >1	必须 <1
空间开销	链表指针开销	无需额外指针

算法原理深入理解

探查聚集（Primary Clustering）问题：

线性探查容易产生"聚集"现象：连续被占用的区域越来越长
新元素哈希到聚集区时，会进一步延长聚集区
这会导致平均查找长度增加，性能下降

解决方案（本文可能未涉及，但值得了解）：

二次探查：hash(key) + 1², +2², +3², ...
双重哈希：使用第二个哈希函数计算步长

待补充

完整文章内容（"两个难点"的具体讲解）
难点1的详细分析和解决方案
难点2的详细分析和解决方案
完整的代码示例
可视化面板说明（如果有）

Link to this note

index

Harness Engineering Wiki - 内容索引本页面由 Claude 自动维护，每次 ingest 新资料后更新📊 Stats总页面数: 151实体页: 2概念页: 81摘要页: 62对比页: 6最后更新: 2026-05-09📚 摘要页 (Summaries)| 页面链接

log

Harness Engineering - 操作日志本页面记录所有 Claude 的操作记录，仅追加，不修改历史记录[2026-05-02] init | 初始化仓库结构创建 raw/ 目录结构（articles, papers, images）创建 wiki/ 目录结构（entities, concepts, summaries, comparison）创建 wiki/index.md 索引页创建 wiki/log.md 操作日志仓库初始化完成[2026-05-02] ingest | 时间空间复杂度入门保存原始内容到 raw/articles/复杂度分析基础.md创建摘要页 wiki/summaries/2026-05-02 时间空间复杂度入门.md侧重：复杂度分析的实用方法（Big O 简化估算技巧）更新 wiki/index.md：摘要页数量 0→1注意：labuladong 实体和复杂度概念首次出现，暂不创建独立页（需 ≥2 篇来源）[2026-05-02] ingest | 数组基础（labuladong）提取网页内容（defuddle）并创建摘要页 wiki/summaries/2026-05-02 数组基础.md创建实体页