桶排序 (Bucket Sort)

将数组分到有限数量的桶里，每个桶分别排序，最后合并结果的非比较排序算法。

定义

桶排序（Bucket Sort） 是一种非比较排序算法，其核心思想是：将数组分到有限数量的桶里，每个桶再分别进行排序（可以使用其他排序算法或递归使用桶排序），最后按桶的顺序合并结果。

核心特性

特性	说明
排序类型	非比较排序
平均时间复杂度	O(n + k)，k 为桶数量
最坏时间复杂度	O(n²)，所有元素落入同一桶
空间复杂度	O(n + k)
稳定性	取决于桶内排序算法
适用场景	数据分布均匀，可预测范围

基本原理

算法步骤

创建桶：根据数据范围创建 k 个桶
分配元素：遍历数组，将每个元素放入对应的桶
桶内排序：对每个非空桶进行排序（可用插入排序、快排等）
合并结果：按桶顺序将元素复制回原数组

简单示例

对 [0.78, 0.17, 0.39, 0.26, 0.72, 0.94, 0.21, 0.12, 0.23, 0.68] 进行桶排序：

桶0 [0.17, 0.12, 0.21, 0.23]
桶1 [0.39, 0.26]
桶2 []
桶3 []
桶4 []
桶5 []
桶6 [0.68]
桶7 [0.78, 0.72]
桶8 []
桶9 [0.94]

桶内排序后合并：[0.12, 0.17, 0.21, 0.23, 0.26, 0.39, 0.68, 0.72, 0.78, 0.94]

时间复杂度/性能

操作	时间复杂度	说明
平均情况	O(n + k)	数据分布均匀，每个桶元素少
最坏情况	O(n²)	所有元素落入同一桶
空间占用	O(n + k)	桶 + 元素存储

关键点：桶排序的效率高度依赖数据的分布和桶数量的选择。

与类似概念对比

维度	桶排序	计数排序	基数排序
排序类型	非比较排序	非比较排序	非比较排序
时间复杂度	O(n + k) 平均	O(n + k)	O(d * (n + k))
数据要求	分布均匀	整数，范围小	整数或可映射
与计数排序关系	通用形式	特例（每桶一种值）	使用计数排序作为子过程
稳定性	取决于桶内排序	可稳定	必须稳定

常见实现要点

桶数量选择：通常 k = n（元素个数），或根据数据范围计算
映射函数：如何将元素映射到桶，bucketIndex = (int)(num * k)
桶内排序：小数组用插入排序，大数组用快排或递归桶排序

注意事项

数据分布要求高：如果数据分布不均匀，效率会大幅下降
不适合所有场景：对于未知分布或分布极差的数据，效果不好
桶数量选择：太少导致桶内元素多，太多导致空间浪费

应用场景

外部排序（数据量太大无法一次性加载）
数据分布可预测的场景
作为基数排序的对比概念

经典算法

计数排序：桶排序的特例，每个桶只有一种值
基数排序：有人认为基数排序是桶排序的应用，但更准确说基数排序是计数排序的扩展
排序算法：桶排序是非比较排序的代表

相关概念

排序算法：桶排序是 O(n) 时间排序算法的代表
计数排序：桶排序的特例（k=n，每桶一个值）
基数排序：与桶排序的关系存在争议

Link to this note

二叉堆

type: concept tags: [数据结构, 堆, 完全二叉树, 优先级队列, 堆排序] created: 2026-05-05 updated: 2026-05-05二叉堆 (Binary Heap)一种特殊的完全二叉树，存储在数组中，通过 sink（下沉）和 swim（上浮）操作维护堆性质，是优先级队列和堆排序的底层数据结构。定义二叉堆（Binary Heap）是一种完全二叉树，通常使用数组（而非链表）存储。根据堆性质分为两种：最大堆（Max Heap）：每个节点都 ≥ 其子节点，堆顶是最大元素最小堆（Min Heap）：每个节点都 ≤ 其子节点，堆顶是最小元素二叉堆的核心价值在于：它能够动态维护一组元素中的最值，核心操作时间复杂度为 O(log n)。核心特性| 特性 | 说明

基数排序

type: concept tags: [排序算法, 非比较排序, 稳定排序, 计数排序] created: 2026-05-09 updated: 2026-05-09基数排序（Radix Sort）基数排序按数字位依次排序，依赖稳定排序保持低位排序结果，是计数排序在多位整数上的扩展应用。定义基数排序（Radix Sort）是一种非比较排序算法。它将待排序元素按“位”拆解，从低位到高位依次进行稳定排序，最终得到整体有序结果。这里的“基数”（radix）指进制。例如十进制整数的基数是 10，二进制整数的基数是 2。核心特性| 特性 | 说明 | |------|------| | 排序类型 | 非比较排序 | | 基础子过程 | 通常使用稳定版 [[计数排序]] | | 稳定性要求 | 每一位排序都必须稳定 | | 数据要求 | 整数，或可以映射成整数的值 | | 时间复杂度 | O(d * (n + k))，d

归并排序

type: concept tags:排序算法分治算法稳定排序 created: 2026-05-05 updated: 2026-05-09归并排序 (Merge Sort)采用分治思想的稳定排序算法，结合二叉树后序遍历理解：先递归处理左右子数组，再合并两个有序数组，时间复杂度稳定为 O(n log n)。定义归并排序（Merge Sort）是一种基于**分治算法（Divide and Conquer）**的排序算法。其核心思想是：先递归地将左右两半子数组排好序，然后在后序位置合并两个有序数组。归并排序的思维模式可以用二叉树的后序遍历来理解：先处理子问题（左右子树），再合并结果（后序位置）。核心特性| 特性 | 说明 | |------|------| | 排序类型 | 比较排序 | | 时间复杂度 | O(n log n)，最坏/平均/最好情况都是 | | 空间复杂度 | O(n)，需要额外数组进行合并 | | 稳定性 | 稳定排序 | | 排序方式 | 原地/非原地（典型实现需要额外空间） | | 思维模式 |

计数排序

type: concept tags: [排序算法, 非比较排序, 线性时间排序] created: 2026-05-05 updated: 2026-05-09计数排序 (Counting Sort)一种非比较排序算法，通过统计元素出现次数实现 O(n + k) 时间复杂度排序，适合元素值范围不大的整数排序场景。定义计数排序（Counting Sort）是一种非比较排序算法，其核心思想是：统计每种元素出现的次数，进而推算出每个元素在排序后数组中的索引位置，最终完成排序。与比较排序（如快速排序、归并排序）不同，计数排序不通过比较元素大小来决定顺序，而是利用元素值作为索引直接定位。核心特性| 特性 | 说明 | |------|------| | 排序类型 | 非比较排序 | | 时间复杂度 | O(n + k)，k = max - min + 1（元素值范围） | | 空间复杂度 | O(n + k) | |

index

Harness Engineering Wiki - 内容索引本页面由 Claude 自动维护，每次 ingest 新资料后更新📊 Stats总页面数: 151实体页: 2概念页: 81摘要页: 62对比页: 6最后更新: 2026-05-09📚 摘要页 (Summaries)| 页面链接

log

Harness Engineering - 操作日志本页面记录所有 Claude 的操作记录，仅追加，不修改历史记录[2026-05-02] init | 初始化仓库结构创建 raw/ 目录结构（articles, papers, images）创建 wiki/ 目录结构（entities, concepts, summaries, comparison）创建 wiki/index.md 索引页创建 wiki/log.md 操作日志仓库初始化完成[2026-05-02] ingest | 时间空间复杂度入门保存原始内容到 raw/articles/复杂度分析基础.md创建摘要页 wiki/summaries/2026-05-02 时间空间复杂度入门.md侧重：复杂度分析的实用方法（Big O 简化估算技巧）更新 wiki/index.md：摘要页数量 0→1注意：labuladong 实体和复杂度概念首次出现，暂不创建独立页（需 ≥2 篇来源）[2026-05-02] ingest | 数组基础（labuladong）提取网页内容（defuddle）并创建摘要页 wiki/summaries/2026-05-02 数组基础.md创建实体页

分治算法解题套路框架

type: summary tags: [分治算法, 算法设计, 递归] created: 2026-05-06 updated: 2026-05-06分治算法解题套路框架[[raw/articles/2026/05/分治算法解题套路框架]]一句话总结区分广义分治思想与狭义分治算法的核心差异，讲解分治算法通过问题分解降低时间复杂度的原理及递归解题框架。核心要点1. 分治思想 vs 分治算法分治思想：宽泛的分解问题思路，将问题拆解为子问题求解后合并，广泛应用于递归算法（如斐波那契递归、二叉树节点计数、动态规划等）分治算法：特指分解后求解比直接求解复杂度更低的递归算法，需满足分解带来的效率提升（如桶排序、归并排序）2. 复杂度降低原理数学类比：$(a+b)^2 = a^2 + 2ab + b^2 \geq a^2 + b^2$原问题规模 $N=a+b$，直接求解 $O(N^2)$ 复杂度为 $O((a+b)^2)$分解为子问题后分别求解，复杂度为 $O(a^2 + b^2) < O((a+b)^2)$适用条件：仅多项式级别复杂度的算法可能通过分治提升效率3. 解题框架分治算法本质是分解问题的递归思路，类似二叉树后序遍历：分解原问题为结构相同的子问题递归求解子问题合并子问题的解得到原问题解基本原理| 概念 | 说明 | |------|------| | 分治思想 | 所有递归算法的两种思路之一（另一种是遍历思路），用于分解问题 | | 分治算法

基数排序-总结

type: summary tags: [算法, 排序, 基数排序, 稳定排序] created: 2026-05-05 updated: 2026-05-05基数排序[[raw/articles/2026/05/基数排序.md]]一句话总结基数排序是 [[计数排序]] 的扩展，对整数的每一位依次进行稳定排序，最终完成整体排序。核心要点1. 基数排序的本质基数（Radix）即进制，适用于整数或可转换整数的数据是计数排序的扩展，用于解决计数排序空间复杂度过高的问题与桶排序关系不大2. 稳定排序的必要性对每一位排序时必须使用稳定排序原因：相同高位或低位的值需要保持原有相对顺序示例：56 和 57，十位数相同（都是5），稳定排序保证个位数顺序不变3. 排序顺序从低位（个位）到高位依次排序由于使用稳定排序，低位排序的结果不会被高位排序破坏基本原理示例：对 nums = [329, 457, 839, 439, 720, 355, 350] 进行基数排序初始状态：329 457 839 439 720 355 350按个位数稳定排序后：720 350 355 457 329 839 439按十位数稳定排序后：720 329 839 439 350 355 457按百位数稳定排序后（最终结果）：329 350 355 439 457 720 839时间复杂度| 操作 | 时间复杂度 | 说明 | |------|-----------|------| | 基数排序 | O(d * (n + k)) | d