打造Go语言的pdqsort排序算法

原创

冲冲冲呀呀呀 2023-09-29 23:40:57 ©著作权

©著作权归作者所有：来自51CTO博客作者冲冲冲呀呀呀的原创作品，请联系作者获取转载授权，否则将追究法律责任

pattern-defeating-quicksort简介

pdqsort是一种不稳定的混合排序算法，采用了快速排序和插入排序的结合，以避免快速排序在小数组上的性能下降。

pdqsort还使用了一些模式避免技术，以减少分支预测错误和缓存行不命中的次数。这些优化使得pdqsort在各种情况下都表现良好，尤其是对于大型、随机分布的数据集。

pdqsort已经被广泛应用于各种编程语言和库中，如Go1.19 Rust、C++等。

何时会认为快速排序的效果表现不佳？

当计算累计$m$ 轮（这里的 $m=f(n)$ ， $f(n)$ 是一个关于序列长度的函数）选取的 pivot 在本轮结束后的位置离数组两端距离小于 $n/8$ 时，即判定快速排序效果表现不好。

总结：结合插入排序、快速排序和堆排序三种排序优势。

在第一个版本中，由于快速排序的速度制约着pdqsort的整体排序效率。

第二个版本主要优化快速排序，具体是优化快速排序中的选取基数pivot的代码。

前两个属于比较极端的选法，而算法需要权衡pivot选取的有效性，也要考虑选取pivot的代价，第三种就是这样做的。

近似中位数选取方法如下：

主要解决如何优化重复元素很多的情况

重复元素较多的情况(partitionEqual)
- 当检测到此时的 pivot 和上次相同时(发生在 leftSubArray)，即partition进行了无效分割，此时认为pivot的值为重复元素，使用 partitionEqual 将重复元素排列在一起，减少重复元素对于 pivot 选择的干扰
当 pivot 选择策略表现不佳时，随机交换元素
- 避免一些极端情况使得 QuickSort 总是表现不佳，以及一些黑客攻击情况