一:概述

桶排序同样还是一种线性时间的排序算法。类似于计数排序中所创建的统计数组,桶排序需要创建若干的桶来协助排序。

二;具体说明

<1>桶是什么

每一个桶(bucket)代表一个区间范围,里面可以承载一个或者多个元素。

<2>桶排序的工作原理

假设有一个非整数数列如下:4.5,0.84,3.25,2.18,0.5

第一步:创建这些桶并确定每一个桶的区间范围

                                 排序算法之桶排序_时间复杂度

具体要创建多少个桶。如何确定桶的区间范围,有很多种不同的方式,我们这里创建桶的桶数量等于原始数列的的元素数量,除最后一个桶只包含数列的最大值之外,前面桶的区间按照比例来确定。

区间跨度 = (最大值-最小值) / (桶的数量-1)

第二步:遍历原始数列,把元素对号入座放入桶内

                                 排序算法之桶排序_i++_02

第三步:对每个桶内的元素分别进行排序(显然,只有第1个桶需要排序)

                                 排序算法之桶排序_时间复杂度_03

第四步:遍历所有的桶,输出所有的元素

0.5,0.84,2.18,3.25,4.5.

<3>桶排序的代码实现

public static double[] bucketSort(double[] array) {

        // 1.得到数列的最大值和最小值,并算出差d
        double max = array[0];
        double min = array[0];
        for (int i = 1; i < array.length; i++) {
            if (array[i] > max) {
                max = array[i];
            }
            if (array[i] < min) {
                min = array[i];
            }
        }
        double d = max - min;
        // 2.初始化桶
        int bucketNum = array.length;
        ArrayList<LinkedList<Double>> bucketList = new ArrayList<LinkedList<Double>>(bucketNum);
        for (int i = 0; i < bucketNum; i++) {
            bucketList.add(new LinkedList<Double>());
        }

        // 3.遍历原始数组,将每个元素放入桶中
        for (int i = 0; i < array.length; i++) {
            int num = (int) ((array[i] - min) * (bucketNum - 1) / d);
            bucketList.get(num).add(array[1]);
        }
        //4.对每个桶内部进行排序
        for (int i = 0; i < bucketList.size(); i++) {
            // JDK底层采用了归并排序或归并的优化版本
            Collections.sort(bucketList.get(i));
        }

        // 输出全部元素
        double[] sortedArray = new double[array.length];
        int index = 0;
        for (LinkedList<Double> list : bucketList) {
            for (double element : list) {
                sortedArray[index] = element;
                index++;
            }
        }
        return sortedArray;
    }


    public static void main(String[] args) {
        double[] array = new double[]{4.12, 6.421, 0.0023, 3.0, 2.123, 8.122, 4.12, 10.09};
        double[] sortedArray = bucketSort(array);
        System.out.println(Arrays.toString(sortedArray));
    }

}

<4>代码说明

在上面的代码中,所有的桶都保存在ArrayList集合当中,每一个桶都被定义成一个链表(LinkedList<Double>),这样便于在尾部插入元素。

同时,上述代码使用了JDK的集合工具类Collections.sort来为桶内部的元素进行排序。Collections.sort底层采用了归并排序或Timsort,可以简单的理解为一种时间复杂度为O(nlogn)的排序。

<5>桶排序的时间复杂度

假设原始数列有n个元素,分成n个桶。

下面逐步来分析一下算法的复杂度:

第1步:求数列的最大和最小值,原酸量为n。

第2步:创建空桶,运算量为n。

第3步:把原始数列的元素分配到各个桶中,运算量为n。

第4步:把每个桶内部做排序,在元素分布相对均匀的情况下,所有的桶的运算之和为n。

第5步:输出排序数列,运算量为n。

因此桶排序的时间复杂度为O(n)。

注意;桶排序的的性能并非绝对稳定,如果元素的分布极不均衡,在极端的情况下,第一个桶中有n-1个元素,最后一个桶中有1个元素。此时的时间复杂度将退化为O(nlogn),而且还创建了许多的空桶浪费了空间。

                                 排序算法之桶排序_时间复杂度_04

三:总结

在前面这已经说了一些具有代表性的排序算法。下面是根据算法的时间复杂度和空间复杂度以及是否稳定做一个总结。

                                 排序算法之桶排序_时间复杂度_05