(转载+原创)经典排序算法c总结与实现

原创

fattyrobbit 2013-08-28 17:08:12 ©著作权

文章标签 c 排序 文章分类 数据结构与算法人工智能

©著作权归作者所有：来自51CTO博客作者fattyrobbit的原创作品，请联系作者获取转载授权，否则将追究法律责任

一.基本概念

1、稳定排序和非稳定排序

简单地说就是所有相等的数经过某种排序方法后，仍能保持它们在排序之前的相对次序，就说这种排序方法是稳定的。反之，就是非稳定的。

2、内排序和外排序

排序过程中，所有需要排序的数都在内存，并在内存中调整它们的存储顺序，称为内排序；

排序过程中，只有部分数被调入内存，并借助内存调整数在外存中的存放顺序排序方法称为外排序。

3、算法的时间复杂度和空间复杂度

时间复杂度，是指执行算法所需要的计算工作量。

空间复杂度，一般是指执行这个算法所需要的内存空间。

二.排序算法实现

-----------------------------------------------------------------

插入排序

有一个已经有序的数据序列，要求在这个已经排好的数据序列中插入一个数，但要求插入后此数据序列仍然有序，这个时候就要用到一种新的排序方法——插入排序法。

插入排序的基本操作就是将一个数据插入到已经排好序的有序数据中，从而得到一个新的、个数加一的有序数据，算法适用于少量数据的排序，时间复杂度为O(n^2)。是稳定的排序方法。

插入算法把要排序的数组分成两部分：第一部分包含了这个数组的所有元素，但将最后一个元素除外，而第二部分就只包含这一个元素。在第一部分排序后，再把这个最后元素插入到此刻已是有序的第一部分里的位置

1.直接插入排序（稳定）

直接插入排序的过程为：在插入第i个记录时，R1,R2,..Ri-1已经排好序，将第i个记录的排序码Ki依次和R1,R2,..,Ri-1的排序码逐个进行比较，找到适当的位置。使用直接插入排序，对于具有n个记录的文件，要进行n-1趟排序。

tips：在C语言中是无法为一个函数传递一个数组过去的，因为在C世界里有一个潜规则：

C语言中，当一维数组作为函数参数的时候，编译器就是把它解析为一个指向其首元素地址的指针变量同样作变返回值时，也是不能如愿的，仍是以指针形式返回的，当然数组变身为一个指针后，其长度就需要单独的一个参考来传递了。

#include <stdio.h>

#include <stdlib.h>

#include <string.h>

void Dir_Insert(int *x,int N);

int main(int argc,char *argv[])

{

int len=0,i=0,strl,j;

char *result=NULL;

strl=strlen(argv[1]);

int copy[strl];

char *str=argv[1];

char *res1=strtok(str,"[");

char *res2=strtok(res1,"]");

result=strtok(res2,",");

while(result!=NULL)

{

copy[i]=atoi(result);//将argv[1]中的字符串取出转换为int存入足够大的数组

result=strtok(NULL,",");

len++;

i++;

}

Dir_Insert(copy,len);

for(j=0;j<len;j++)

{

printf("%d ",copy[j]);

}

printf("\n");

exit(0);

}

void Dir_Insert(int *x,int N)

{

int i,j,tmp;

for(i=1;i<N;i++)

{

tmp=*(x+i);

j=i-1;

while(*(x+j)>tmp && j>=0)

{

*(x+j+1)=*(x+j);

j--;

}

*(x+j+1)=tmp;

}

结果为：

2.希尔排序(不稳定)

Shell排序的基本思想是：先取一个小于n的整数d1作为第一个增量把文件的全部记录分成d1个组。所有距离为d1的倍数的记录放在同一个组中。先在各组内进行直接插入排序；然后，取得第二个增量d2<d1重复上述的分组和排序，直至所取的增量di=1，即所有记录放在同一组中进行直接插入排序为止。该方法实质上是一种分组插入方法。

void shell_sort(int *x, int N)

{

int h, j, k, t;

for (h=N/2; h>0; h=h/2)//保证增量为奇数

{

for (j=h; j<N; j++)

{

t = *(x+j);

for (k=j-h; (k>=0 && t<*(x+k)); k-=h)

{

*(x+k+h) = *(x+k);

}

*(x+k+h) = t;

}

-----------------------------------------------------------------

选择排序

设数组内存放了n个待排数字，数组下标从1开始，到n结束。
i=1
从数组的第i个元素开始到第n个元素，寻找最小的元素。
将上一步找到的最小元素和第i位元素交换。
如果i=n－1算法结束，否则回到第3步

①.直接选择排序(不稳定)
直接选择排序的过程是：首先在所有记录中选出序码最小的记录，把它与第1个记录交换，然后在其余的记录内选出排序码最小的记录，与第2个记录交换......依次类推，直到所有记录排完为止。
无论文件初始状态如何，在第i趟排序中选出最小关键字的记录，需要做n-i次比较，因此，总的比较次数为n(n-1)/2=O(n^2)。当初始文件为正序时，移动次数为0；文件初态为反序时，每趟排序均要执行交换操作，总的移动次数取最大值3(n-1)。直接选择排序的平均时间复杂度为O(n^2)。直接选择排序是不稳定的。

void select_sort(int *x, int n)

{

int i, j, min, t;

for (i=0; i<n-1; i++) /*要选择的次数：0~n-2共n-1次*/

{

min = i; /*假设当前下标为i的数最小，比较后再调整*/

for (j=i+1; j<n; j++)/*循环找出最小的数的下标是哪个*/

{

if (*(x+j) < *(x+min))

{

min = j; /*如果后面的数比前面的小，则记下它的下标*/

}

if (min != i) /*如果min在循环中改变了，就需要交换数据*/

{

t = *(x+i);

*(x+i) = *(x+min);

*(x+min) = t;

}

②.堆排序(不稳定)
首先新建一个空列表，作用与插入排序中的"有序列表"相同。　找到数列中最大的数字，将其加在"有序列表"的末尾，并将其从原数列中删除。重复2号步骤，直至原数列为空。堆排序的平均时间复杂度为nlogn,效率高（因为有堆这种数据结构以及它奇妙的特征，使得"找到数列中最大的数字"这样的操作只需要O(1)的时间复杂度，维护需要logn的时间复杂度），但是实现相对复杂（可以说是这里7种算法中比较难实现的）。看起来似乎堆排序与插入排序有些相像，但他们其实是本质不同的算法。至少，他们的时间复杂度差了一个数量级，一个是平方级的，一个是对数级的。

堆排序是一种树形选择排序，是对直接选择排序的有效改进。n个关键字序列
K1,K2,...,Kn称为堆，当且仅当该序列满足(Ki<=K2i且Ki<=K2i+1)或(Ki>=K2i且Ki>=K2i+1),(1<=i<=n/2)。根结点(堆顶)的关键字是堆里所有结点关键字中最小者，称为小根堆；根结点的关键字是堆里所有结点关键字中最大者，称为大根堆。
若将此序列所存储的向量R[1..n]看作是一棵完全二叉树的存储结构，则堆实质上是满足如下性质的完全二叉树：树中任一非叶结点的关键字均不大于(或不小于)其左右孩子(若存在)结点的关键字。
堆排序的关键步骤有两个：一是如何建立初始堆；二是当堆的根结点与堆的最后一个结点交换后，如何对少了一个结点后的结点序列做调整，使之重新成为堆。堆排序的最坏时间复杂度为O(nlog2n),堆排序的平均性能较接近于最坏性能。由于建初始堆所需的比较次数较多，所以堆排序不适宜于记录较少的文件。堆排序是就地排序，辅助空间为O(1)，它是不稳定的排序方法。

代码略...

====================================

三.交换排序

两两比较待排序记录的排序码，并交换不满足顺序要求的那写偶对，直到满足条件为止。交换排序的主要方法有冒泡排序和快速排序.

①.冒泡排序(稳定的)
在要排序的一组数中，对当前还未排好序的范围内的全部数，自上而下对相邻的两个数依次进行比较和调整，让较大的数往下沉，较小的往上冒。即：每当两相邻的数比较后发现它们的排序与排序要求相反时，就将它们互换。

void BubbleSort(int *x,int N)

{

int tmp,i,j;

for (i=N-1;i>0;i--)

{

for (j=0;j<i;j++)

{

if (*(x+j)>*(x+j+1))

{

tmp=*(x+j);

*(x+j)=*(x+j+1);

*(x+j+1)=tmp;

}

②.快速排序：(不稳定的)

快速排序是对冒泡排序的一种本质改进。它的基本思想是通过一趟扫描后，使得排序序列的长度能大幅度地减少。在冒泡排序中，一次扫描只能确保最大数值的数移到正确位置，而待排序序列的长度可能只减少1。快速排序通过一趟扫描，就能确保某个数（以它为基准点吧）的左边各数都比它小，右边各数都比它大。然后又用同样的方法处理它左右两边的数，直到基准点的左右只有一个元素为止。

显然快速排序可以用递归实现，当然也可以用栈化解递归实现。下面的函数是用递归实现的，有兴趣的朋友可以改成非递归的。

快速排序是不稳定的。最理想情况算法时间复杂度O(nlog2n)，最坏O(n2)

void quick_sort(int *x, int low, int high)

{

int i, j, t;

if (low < high) /*要排序的元素起止下标，保证小的放在左边，大的放在右边。这里以下标为low的元素为基准点*/

{

i = low;

j = high;

t = *(x+low); /*暂存基准点的数*/

while (i<j) /*循环扫描*/

{

while (i<j && *(x+j)>t) /*在右边的只要比基准点大仍放在右边*/

{

j--; /*前移一个位置*/

}

if (i<j)

{

*(x+i) = *(x+j); /*上面的循环退出：即出现比基准点小的数，替换基准点的数*/

i++; /*后移一个位置，并以此为基准点*/

}

while (i<j && *(x+i)<=t) /*在左边的只要小于等于基准点仍放在左边*/

{

i++; /*后移一个位置*/

}

if (i<j)

{

*(x+j) = *(x+i); /*上面的循环退出：即出现比基准点大的数，放到右边*/

j--; /*前移一个位置*/

}

*(x+i) = t; /*一遍扫描完后，放到适当位置*/

quick_sort(x,low,i-1); /*对基准点左边的数再执行快速排序*/

quick_sort(x,i+1,high); /*对基准点右边的数再执行快速排序*/

}

==================================

四.归并排序
归并排序是将两个或两个以上的有序子表合并成一个新的有序表。初始时，把含有n个结点的待排序序列看作由n个长度都为1的有序子表组成，将它们依次两两归并得到长度为2的若干有序子表，再对它们两两合并。直到得到长度为n的有序表，排序结束。
归并排序是一种稳定的排序，可用顺序存储结构，也易于在链表上实现，对长度为n的文件，需进行log2n趟二路归并，每趟归并的时间为O(n),故其时间复杂度无论是在最好情况下还是在最坏情况下均是O(nlog2n)。归并排序需要一个辅助向量来暂存两个有序子文件归并的结果，故其辅助空间复杂度为O(n),显然它不是就地排序。

代码略...

===================================

总结

按平均时间将排序分为四类：
（1）平方阶(O(n2))排序
　一般称为简单排序，例如直接插入、直接选择和冒泡排序；
（2）线性对数阶(O(nlgn))排序
　如快速、堆和归并排序；
（3）O(n1+￡)阶排序
　￡是介于0和1之间的常数，即0<￡<1，如希尔排序；
（4）线性阶(O(n))排序
　如基数排序。

各种排序方法比较
简单排序中直接插入最好，快速排序最快，当文件为正序时，直接插入和冒泡均最佳。

不同条件下，排序方法的选择

(1)若n较小(如n≤50)，可采用直接插入或直接选择排序。
(2)若文件初始状态基本有序(指正序)，则应选用直接插人、冒泡或随机的快速排序为宜；
(3)若n较大，则应采用时间复杂度为O(nlgn)的排序方法：快速排序、堆排序或归并排序。

快速排序是目前基于比较的内部排序中被认为是最好的方法，当待排序的关键字是随机分布时，快速排序的平均时间最短；
堆排序所需的辅助空间少于快速排序，并且不会出现快速排序可能出现的最坏情况。这两种排序都是不稳定的。若要求排序稳定，则可选用归并排序。但从单个记录起进行两两归并的排序算法并不值得提倡，通常可以将它和直接插入排序结合在一起使用。先利用直接插入排序求得较长的有序子文件，然后再两两归并之。因为直接插入排序是稳定的，所以改进后的归并排序仍是稳定的。