堆排序（Heap Sort）

基于二叉堆结构的原地排序算法，时间复杂度 O(N log N)，空间复杂度 O(1)。

定义

堆排序是从二叉堆结构衍生出来的排序算法，主要分两步：

原地建堆（Heapify）：在待排序数组上原地创建二叉堆
原地排序（Sort）：将堆顶元素不断取出，最终得到有序结果

堆排序不需要额外的辅助空间，直接在原数组上进行 sink, swim 操作完成排序。

核心特性

特性	说明
时间复杂度	O(N log N)
空间复杂度	O(1)（原地排序）
稳定性	不稳定
适合场景	空间受限、需要保证 O(N log N) 最坏情况

基本原理

堆排序基于二叉堆的 sink/swim 操作：

建堆（Heapify）：从最后一个非叶子节点开始，向前遍历，对每个节点执行 sink 操作，将无序数组调整为二叉堆
排序（Sort）：
- 将堆顶元素（最大/最小）与堆尾元素交换
- 堆的大小减1
- 对新的堆顶执行 sink 操作
- 重复直到堆为空

初始数组: [4, 10, 3, 5, 1]
建堆后:   [10, 5, 3, 4, 1]  (大顶堆)
排序过程:
  交换堆顶与堆尾: [1, 5, 3, 4, 10], 对[1,5,3,4] sink -> [5,4,3,1,10]
  交换堆顶与堆尾: [1,4,3,5,10], 对[1,4,3] sink -> [4,1,3,5,10]
  ...最终得到: [1, 3, 4, 5, 10]

与类似概念对比

维度	堆排序	快速排序	归并排序
时间复杂度	O(N log N)	平均 O(N log N)，最坏 O(N²)	O(N log N)
空间复杂度	O(1)	O(log N) 递归栈	O(N)
稳定性	不稳定	不稳定	稳定
原地排序	是	是	否
最坏情况	O(N log N)	O(N²)	O(N log N)

时间复杂度/性能

操作	时间复杂度	说明
建堆（Heapify）	O(N)	从最后一个非叶子节点开始 sink
排序（每次取堆顶）	O(log N)	每次 sink 操作
总排序时间	O(N log N)	N 个元素，每个 O(log N)
空间复杂度	O(1)	原地排序，不需要额外空间

常见类型/变体

1. 基于大顶堆的升序排序

使用大顶堆，每次将堆顶最大元素交换到末尾，得到升序数组。

2. 基于小顶堆的降序排序

使用小顶堆，每次将堆顶最小元素交换到末尾，得到降序数组。

核心组件

sink（下沉）操作

将节点与子节点比较，如果小于（大顶堆）或大于（小顶堆）子节点，则交换，直到满足堆性质。

swim（上浮）操作

将节点与父节点比较，如果大于（大顶堆）或小于（小顶堆）父节点，则交换，直到满足堆性质。

注意事项

学习堆排序算法必须掌握二叉堆结构原理，否则可能完全无法理解排序过程
堆排序是不稳定排序（相同元素的相对位置可能改变）
建堆的时间复杂度是 O(N)，不是 O(N log N)（因为底层节点高度较小）
可以用算法可视化工具观察建堆和排序过程

常见实现

实现	特点
递归实现	代码简洁，但递归栈有开销
迭代实现	避免递归，直接循环完成 sink/swim

关键技巧

原地建堆（Heapify）

从最后一个非叶子节点（索引 n/2 - 1）开始，向前遍历，对每个节点执行 sink 操作。

排序过程

排序时，将堆顶与堆尾交换后，需要对新的堆顶执行 sink，但堆的大小要减1（排除已排序的部分）。

应用场景

需要 O(N log N) 时间复杂度且空间受限的场景
实时系统（保证最坏情况 O(N log N)，不像快速排序可能退化到 O(N²)）
内省排序（IntroSort）的组成部分：C++ 的 std::sort 结合快速排序、堆排序、插入排序

经典算法

快速排序：平均更快，但最坏情况差
归并排序：稳定但需要额外空间
内省排序（IntroSort）：结合三者优点，先用快速排序，当递归深度超过阈值时切换到堆排序

相关概念

二叉堆：堆排序的基础数据结构
优先级队列：基于二叉堆实现，堆排序的简单思路就是利用优先级队列
排序算法：各种排序算法的分类与对比
原地排序：不需要额外 O(N) 空间的排序方法
时间复杂度：O(N log N) 的分析

Link to this note

二叉堆

type: concept tags: [数据结构, 堆, 完全二叉树, 优先级队列, 堆排序] created: 2026-05-05 updated: 2026-05-05二叉堆 (Binary Heap)一种特殊的完全二叉树，存储在数组中，通过 sink（下沉）和 swim（上浮）操作维护堆性质，是优先级队列和堆排序的底层数据结构。定义二叉堆（Binary Heap）是一种完全二叉树，通常使用数组（而非链表）存储。根据堆性质分为两种：最大堆（Max Heap）：每个节点都 ≥ 其子节点，堆顶是最大元素最小堆（Min Heap）：每个节点都 ≤ 其子节点，堆顶是最小元素二叉堆的核心价值在于：它能够动态维护一组元素中的最值，核心操作时间复杂度为 O(log n)。核心特性| 特性 | 说明

优先级队列

type: concept tags: [数据结构, 优先级队列, 二叉堆, 队列] created: 2026-05-05 updated: 2026-05-05优先级队列（Priority Queue）基于二叉堆实现的数据结构，能够按照元素的优先级顺序（而非插入顺序）取出元素。定义优先级队列是一种特殊的队列，每个元素都有优先级，出队时总是优先级最高（或最低）的元素先出队。通常使用二叉堆（小顶堆或大顶堆）作为底层实现，保证插入和删除的时间复杂度为 O(log N)。核心特性| 特性 | 说明 | |------|------| | 底层结构 | 二叉堆（数组实现的完全二叉树） | | 插入元素 | O(log N) | | 删除堆顶 | O(log N) | | 查看堆顶 | O(1) | | 常见类型 | 小顶堆（最小元素优先）、大顶堆（最大元素优先） |基本原理优先级队列底层使用数组实现，但逻辑上是一棵完全二叉树，依靠 swim（上浮）和 sink（下沉）方法维护堆的性质：插入元素：将元素追加到数组末尾，然后调用 swim

原地排序

type: concept tags: [排序算法特性, 空间复杂度] created: 2026-05-06 updated: 2026-05-06原地排序（In-place Sort）定义原地排序是指仅需 O(1) 额外空间（不算输入数组本身）的排序算法。算法通过直接修改输入数组来完成排序，不需要额外的数组来存储中间结果。核心特性| 特性 | 说明 | |------|------| | 空间复杂度 | O(1)（仅需常数级额外变量） | | 实现方式 | 通过元素交换或移动，直接在原数组上操作 | | 优点 | 节省内存，适合内存受限场景 | | 缺点 | 实现可能较复杂，某些算法（如堆排序）实际性能可能不如预期 |常见原地排序算法| 算法 | 时间复杂度（平均） | 稳定性 | 说明 | |------|-------------------|--------|------| | 选择排序 | O(n²)

index

Harness Engineering Wiki - 内容索引本页面由 Claude 自动维护，每次 ingest 新资料后更新📊 Stats总页面数: 151实体页: 2概念页: 81摘要页: 62对比页: 6最后更新: 2026-05-09📚 摘要页 (Summaries)| 页面链接

log

Harness Engineering - 操作日志本页面记录所有 Claude 的操作记录，仅追加，不修改历史记录[2026-05-02] init | 初始化仓库结构创建 raw/ 目录结构（articles, papers, images）创建 wiki/ 目录结构（entities, concepts, summaries, comparison）创建 wiki/index.md 索引页创建 wiki/log.md 操作日志仓库初始化完成[2026-05-02] ingest | 时间空间复杂度入门保存原始内容到 raw/articles/复杂度分析基础.md创建摘要页 wiki/summaries/2026-05-02 时间空间复杂度入门.md侧重：复杂度分析的实用方法（Big O 简化估算技巧）更新 wiki/index.md：摘要页数量 0→1注意：labuladong 实体和复杂度概念首次出现，暂不创建独立页（需 ≥2 篇来源）[2026-05-02] ingest | 数组基础（labuladong）提取网页内容（defuddle）并创建摘要页 wiki/summaries/2026-05-02 数组基础.md创建实体页

堆排序-总结

type: summary tags: [排序算法, 堆排序, 二叉堆, 原地排序, 时间复杂度] created: 2026-05-05 updated: 2026-05-05堆排序[[raw/articles/2026/05/堆排序]]一句话总结堆排序是基于二叉堆结构的原地排序算法，复杂度为 O(N log N)，通过原地建堆（Heapify）和排序两个步骤完成。核心要点1. 堆排序的两个关键步骤原地建堆（Heapify）：直接把待排序数组原地变成一个二叉堆。排序（Sort）：将元素不断地从堆中取出，最终得到有序的结果。2. 堆排序与优先级队列的关系最简单的堆排序思路是直接利用优先级队列：把所有元素塞到优先级队列里面，然后再取出来。但这种方法空间复杂度是 O(N)，因为需要额外的数据结构。堆排序解决的问题是：不要使用额外的辅助空间，直接在原数组上进行 sink, swim 操作，在 O(N log N) 的时间内完成排序。3. 二叉堆的关键原理二叉堆（优先级队列）底层是用数组实现的，但是逻辑上是一棵完全二叉树，主要依靠 swim, sink 方法来维护堆的性质。优先级队列可以分为小顶堆和大顶堆，小顶堆会将整个堆中最小的元素维护在堆顶，大顶堆会将整个堆中最大的元素维护在堆顶。优先级队列插入元素时，首先把元素追加到二叉堆底部，然后调用 swim 方法把该元素上浮到合适的位置，时间复杂度是 O(log N)。优先级队列删除堆顶元素时，首先把堆底的最后一个元素交换到堆顶作为新的堆顶元素，然后调用 sink 方法把这个新的堆顶元素下沉到合适的位置，时间复杂度是 O(log N)。基本原理堆排序基于二叉堆结构，通过 swim（上浮）和 sink（下沉）操作维护堆性质。利用优先级队列的简单实现思路：// 直接利用优先级队列对数组从小到大排序 void sort(int[] nums) {

桶排序-总结

type: summary tags:排序算法桶排序计数排序算法思想 created: 2026-05-05 updated: 2026-05-05桶排序[[raw/articles/2026/05/桶排序]]一句话总结桶排序通过「分配元素到桶 → 对每个桶排序 → 合并有序桶」三步骤实现排序，是归并排序与计数排序的通用形式。核心要点1. 桶排序三步骤分配：将待排序数组中的元素使用映射函数分配到若干个「桶」中排序：对每个桶中的元素进行排序（可使用任意排序算法）合并：将这些排好序的桶按顺序合并，得到最终排序结果2. 桶排序与归并排序的联系桶排序的思路类似归并排序：都是把大的数组分成小的数组进行排序，最后再合并。但桶排序更加灵活：归并排序是固定二分（k=2）桶排序可灵活决定桶的数量 k 和映射函数3. 桶排序与计数排序的联系当桶的数量 k 无限大，每个桶至多只有一个元素时，桶排序就转化成了计数排序，复杂度降低到 O(n)。关系总结：桶排序 (通用形式) ├─ k=2 时 → 类似归并排序 └─ k 足够大时 → 计数排序4. 分开排序更高效（数学证明）以选择排序为例：直接对大小为 n 的数组排序，时间复杂度 O(n²)。若将数组分成 k 个桶，每个桶大小为 n₁, n₂, ..., nₖ（n =