查找给定区间内第K大的元素

原创

legend05070911 2022-12-13 17:06:05 博主文章分类：数据结构与算法 ©著作权

文章标签 给定区间第K大数组最小堆快速排序 文章分类 运维

©著作权归作者所有：来自51CTO博客作者legend05070911的原创作品，请联系作者获取转载授权，否则将追究法律责任

查找给定区间内第K大的元素：

（一）方法一：最小堆：O( n*lg(k) )
（1）思想：
1.建立一个大小为k的最小堆
2.注意：是给定区间，堆中存放的是给定区间的元素，不是给定区间的元素不会存放。

说明：这个问题有些类似于n个数中查找最大的top(k)问题；

建立大小为k的最小堆，后续的n-k个数，每次和堆顶元素进行比较，比其大，则替换堆顶的值，调整最小堆；

调整最小堆的复杂度为o(lgk),所以整体复杂度为 O(n*lgk)

（二）方法二：快速排序之partion: O(n )
（1）思想：
快速排序的partion返回值i表示的是array[0~i-1]<=array[i]<=array[i+1~n-1];
如果i>k,则只需要在0~i-1区间继续partion，否则在i+1~n-1区间划分。

（2）解析：

有一个大小为 n的数组A[0,1,2,…,n-1]，求其中第k大的数。

我们先取特例，令k=1，那么就是取最大的数，只要扫描一遍数组就可以确定该值，如果k=2，则扫描两边数组就可以确定第二大的数，依此类推下去，时间复杂度是O(k*n)，如果k跟n是一个数量级，那么时间复杂度就是O(n*n)了，显然不是最优的解法。

考虑分治法，难点在于如何将该问题分解为两个子问题。

快速排序最基础的一步：

随机取某一个数x，将其与数组末尾元素交换，然后将比其小的数交换至前，比其大的数交换至后。

这一步使某一数组的快速排序问题分解成两个子数组的排序问题，现在我们就依此来解决取第k大的数这个问题。

设数组下表从0开始，至n-1结束。

1、随机取某个数，将其与数组末尾元素交换。

a) idx=rand(0,n-1);生成[0,n-1]间的随机数。

b) Swap(array[idx], array[n-1]);

2、用末尾元素x，将比x小的数交换至前，比x大的数交换至后，并返回此时x在数组中的位置mid。

3、如果mid==n-k，那么返回该值，这就是第k大的数。

如果mid>n-k，那么第k大的数在左半数组，且在左半数组中是第k-(n-mid)大的数。

如果mid<n-k，那么第k大的数在右半数组，而且仍然是第k的数。

（3）代码实现：

#include "iostream"
 using namespace std;int random_partion(int *p, int n)
 {
      int idx=rand()%n;
      swap(p[idx], p[n-1]);
      int i=-1;    //i表示最后一个小于p[n-1]的元素的位置
      int j=0;     //j用来扫描数组
      for(j=0; j<n; j++)
      {
             //将小于p[n-1]的数交换到前半部分
             if(p[j]<p[n-1])
             {
     swap(p[++i], p[j]);
             }
      }
      swap(p[++i], p[n-1]);
      return i;
 }int getMaxK(int *p, int n, int k)
 {
  int mid;
      if(k<=0)
             return -1;
      if(n<k)
             return -1;
   mid=random_partion(p, n);   //对原数组进行一次划分
      if(mid == n-k)      //如果mid==n-k，那么返回该值，这就是第k大的数
    return p[mid];
      else if(mid<n-k)
    return getMaxK(p+mid+1, n-mid-1, k);  //如果mid<n-k，那么第k大的数在右半数组，而且仍然是第k大数
      else
    return getMaxK(p, mid, k-(n-mid));   //如果mid>n-k，那么第k大的数在左半数组，且在左半数组中是第k-(n-mid)大的数
 }int main(void)
 {
  int num,a[] = {12012, 3, 945, 965, 66, 232, 65, 7, 8, 898, 56, 878, 170, 13, 5};
  num=getMaxK(a, 15, 4);
  printf("%d\n",num);
  system("pause");
  return 0;
 }

（三）方法三：选择排序：O(k*n)

（四）伴随数组：O(n*lgn+n)

（1）范例：
如数组A[n]={1,3,2,5,4,7,6,9,8}
则下标在[3~6]范围内第3大的数为：即{5,4,7,6}范围内第3大的数为5.

（2）代码实现：

#include<iostream>
 #include<algorithm>
 using namespace std;struct node{
 int num,data;//data表示的是元素的值，num代表的是元素最初的下标。bool operator < (const node &p) const{
 return data < p.data;
 }
 };node p[100001];
int main()
 {
 int n=7;
 int i,j,a,b,c;
 for(i=1;i<=n;i++)//假定元素时从1开始存储。
 {
 scanf("%d",&p[i].data);
 p[i].num = i;
 }sort(p+1,p+1+n); //调用库函数sort完成排序，复杂度n*logn
 scanf("%d %d %d",&a,&b,&c);
 //[a,b]表示的是限定的区间，c表示要求的第k大的数。
 for(i=1;i<=n;i++) //扫描一遍，复杂度n
 {
 if(p[i].num>=a && p[i].num<=b)
 c--;
 if(c == 0)
 break;
 }
 printf("%d/n",p[i].data);
 return 0;
 }