希尔排序的实质就是分组插入排序,该方法又称缩小增量排序,因DL.Shell于1959年提出而得名。

 希尔排序原理
        现在,我要讲解的算法叫希尔排序(Shell Sort)。希尔排序是D.L.Shell于1959年提出来的一种排序算法,在这之前排序算法的时间复杂度基本都是O(n2)的,希尔排序算法是突破这个时间复杂度的第一批算法之一。
        我们前一节讲的直接插入排序,应该说,它的效率在某些时候是很高的,比如,我们的记录本身就是基本有序的,我们只需要少量的插入操作,就可以完成整个记录集的排序工作,此时直接插入很高效。还有就是记录数比较少时,直接插入的优势也比较明显。可问题在于,两个条件本身就过于苛刻,现实中记录少或者基本有序都属于特殊情况。
        不过别急,有条件当然是好,条件不存在,我们创造条件,也是可以去做的。于是科学家希尔研究出了一种排序,对直接插入排序改进后可以增加效率的方法。
        如何让待排序的记录个数较少呢?很容易想到的就是将原本有大量记录数的记录进行分组。分割成若干个子序列,此时每个子序列待排序的记录个数就比较少了。然后在这些子序列内分别进行直接插入排序,当整个序列都基本有序时,注意只是基本有序时,再对全体记录进行一次直接插入排序。
        此时一定有同学开始疑惑了。这不对呀,比如我们现在有序列是{9,1,5,8,3,7,4,6,2},现在将它分成三组,{9,1,5},{8,3,7},{4,6,2},哪怕将它们各自排序排好了,变成{1,5,9},{3,7,8},{2,4,6},再合并它们成{1,5,9,3,7,8,2,4,6},此时,这个序列还是杂乱无序,谈不上基本有序,要排序还是重来一遍直接插入有序,这样做有用吗?需要强调一下,所谓的基本有序,就是小的关键字基本在前面,大的基本在后面,不大不小的基本在中间,像{2,1,3,6,4,7,5,8,9}这样可以称为基本有序了。但像{1,5,9,3,7,8,2,4,6}这样的9在第三位,2在倒数第三位就谈不上基本有序。
        问题其实也就在这里,我们分割待排序记录的目的是减少待排序记录的个数,并使整个序列向基本有序发展。而如上面这样分完组后,就各自排序的方法达不到我们的要求。因此,我们需要采取跳跃分割的策略:将相距某个“增量”的记录组成一个子序列,这样才能保证在子序列内分别进行直接插入排序后得到的结果是基本有序而不是局部有序

该方法的基本思想是:先将整个待排元素序列分割成若干个子序列(由相隔某个“增量”的元素组成的)分别进行直接插入排序,然后依次缩减增量再进行排序,待整个序列中的元素基本有序(增量足够小)时,再对全体元素进行一次直接插入排序。因为直接插入排序在元素基本有序的情况下(接近最好情况),效率是很高的,因此希尔排序在时间效率上比前两种方法有较大提高。

 

以n=10的一个数组49, 38, 65, 97, 26, 13, 27, 49, 55, 4为例

第一次 gap = 10 / 2 = 5
49   38   65   97   26   13   27   49   55   4
1A                                                  1B
           2A                                                   2B
                     3A                                                    3B
                                 4A                                                   4B
                                            5A                                                  5B

1A,1B,2A,2B等为分组标记,数字相同的表示在同一组,大写字母表示是该组的第几个元素, 每次对同一组的数据进行直接插入排序。即分成了五组(49, 13) (38, 27) (65, 49)  (97, 55)  (26, 4)这样每组排序后就变成了(13, 49)  (27, 38)  (49, 65)  (55, 97)  (4, 26),下同。

第二次 gap = 5 / 2 = 2

排序后

13   27   49   55   4    49   38   65   97   26

1A                 1B                 1C                 1D               1E

           2A                2B                 2C                 2D                2E

第三次 gap = 2 / 2 = 1

4   26   13   27   38    49   49   55   97   65

1A    1B      1C     1D        1E       1F       1G      1H       1I       1J

第四次 gap = 1 / 2 = 0 排序完成得到数组:

4   13   26   27   38    49   49   55   65   97

 

下面给出严格按照定义来写的希尔排序

void shellsort1(int a[], int n)
{
       int i, j, gap;
 
       for (gap = n / 2; gap > 0; gap /= 2)   //步长
              for (i = 0; i < gap; i++)         //按组排序    
              {
                     for (j = i + gap; j < n; j += gap)  
                     {
                            if (a[j] < a[j - gap])
                            {
                                   int temp = a[j];
                                   int k = j - gap;
                                   while (k >= 0 && a[k] > temp)
                                   {
                                          a[k + gap] = a[k];
                                          k -= gap;
                                   }
                                   a[k + gap] = temp;
                            }
                     }
}
}

很明显,上面的shellsort1代码虽然对直观的理解希尔排序有帮助,但代码量太大了,不够简洁清晰。因此进行下改进和优化,以第二次排序为例,原来是每次从1A到1E,从2A到2E,可以改成从1B开始,先和1A比较,然后取2B与2A比较,再取1C与前面自己组内的数据比较…….。这种每次从数组第gap个元素开始,每个元素与自己组内的数据进行直接插入排序显然也是正确的。

void shellsort2(int a[], int n)
{
       int j, gap;
      
       for (gap = n / 2; gap > 0; gap /= 2)
              for (j = gap; j < n; j++)   //从数组第gap个元素开始
                     if (a[j] < a[j - gap])  //每个元素与自己组内的数据进行直接插入排序      
                     {
                            int temp = a[j];
                            int k = j - gap;
                            while (k >= 0 && a[k] > temp)
                            {
                                   a[k + gap] = a[k];
                                   k -= gap;
                            }
                            a[k + gap] = temp;
                     }
}
#include<stdio.h>
/*
设数组为a[0…n-1]。1. 初始时,a[0]自成1个有序区,无序区为a[1..n-1]。令i=1
2. 将a[i]并入当前的有序区a[0…i-1]中形成a[0…i]的有序区间。
3. i++并重复第二步直到i==n-1。排序完成。
由小到大排序 O(n*n),稳定,关键是:一直跟比它大的直接交换,
直到遇到小的才不换直接跳出(这时其实已经位置对了,不用换),此时已经排好
     关键是用个临时变量,将a[i]存储起来也就是,那么就可以让出这个a[j+1]的空位置令数组
     向后移,最后把关键字插入 
*/
//升序排序, 
void insertSort(int a[],int length)
{
     for(int i=1;i<length;i++)
     {
             if(a[i]<a[i-1])//加个判断,减少交换次数 
             { 
               int temp=a[i];//temp记录左要插入的值,所以直接向后移就OK了 
               int j=i-1;
                  while(temp<a[j]&&j>=0)//凡是比它大的,向后移 
                  {
                     a[j+1]=a[j]; 
                     j--;       
                  }
                  a[j+1]=temp;//最后将关键字插入 j j+1 a[j+1]
             }
     }
     
}
void shellsort1(int a[], int n)
{
     int i, j, gap;
     for (gap = n / 2; gap > 0; gap /= 2)   //步长
         for (i = 0; i < gap; i++)         //按组排序    
         {
             for (j = i + gap; j < n; j += gap)  
             {
                // if (a[j] < a[j - gap])
                 //{
                    int temp = a[j];
                    int k = j - gap;
                           while (k >= 0 && a[k] > temp)
                           {
                           a[k + gap] = a[k];
                           k -= gap;
                           }
                          a[k + gap] = temp;
                 //}
             }         }
}
 int main()
 {
     int a[10]={8,2,6,12,1,9,5,5,10,7};
     insertSort(a,10);
    // shellsort1(a,10);
     for(int i=0;i<10;i++)
     printf("%d ",a[i]);
     getchar();
     return 0;
 }