划分树是一种基于线段树的数据结构。主要用于快速求出(在log(n)的时间复杂度内)序列区间的第k大值


如图即一棵划分树:


先来看下结构体:



struct node
{
	int val[maxn];
	int num[maxn];
}tree[30];

树形结构都有层次之分,我们假设根为第0层。



上面的val数组是用来记录当前层的元素的,而num数组则是用来存当前位置以前的被划到左子树的元素个数。



接下来讲下建树过程



    划分树建树基于一个已排完序的数组,将比中值大的元素划到右子树,比中值小的元素划到左子树,如果有多个和中值一样大的元素,那么用一个变量isame=(mid-l+1),先假设用这么多个和中值一样大的,然后for循环一遍,踢掉比中值小的,最后的isame就是要划到左子树的。其实isame原理是这样的,本来左子树就应该有mid-l+1个元素,减去那些比中值小的(即本来就要划到左子树的),那么此时isame就是左子树还需要的元素个数,那么就从中值元素中去isame个来放到左边,其他的放到右边。



具体看下面代码:



void build(int ind,int l,int r)
{
	if(l == r)//到叶子
	  return ;
    int mid=(l+r)>>1;
    int isame=mid-l+1,same=0;
    for(int i=l;i<=r;i++)
      if(sorted[mid] > tree[ind].val[i])
        isame--;//排除比中值小的
    int ln=l;//划分给下一层左子树的,开始位置
    int rn=mid+1;//划分给下一层右子树的,开始位置
    for(int i=l;i<=r;i++)
    {
    	if(l == i)//第一个元素之前没有被划到左子树的,所以初始化为0
    	{
	    	tree[ind].num[i]=0;
	    }
	    else
	    {
    		tree[ind].num[i]=tree[ind].num[i-1];
    	}
    	if(tree[ind].val[i] > sorted[mid])//如果大于中值,划到右边
    	{
	    	tree[ind+1].val[rn++]=tree[ind].val[i];
	    }
	    else if(tree[ind].val[i] < sorted[mid])//小于中值,分给左边
	    {
    		tree[ind+1].val[ln++]=tree[ind].val[i];
    		tree[ind].num[i]++;
    	}
    	else//和中值一样大
    	{
	    	if(isame >same)//还要划到左边
	    	{
	    		same++;
	    		tree[ind+1].val[ln++]=tree[ind].val[i];
	    		tree[ind].num[i]++;
	    	}
	    	else//划给右边
	    	{
	    		tree[ind+1].val[rn++]=tree[ind].val[i];
	    	}
	    }
    }
    build(ind+1,l,mid);//递归左右子树
    build(ind+1,mid+1,r);
}

建树小结:



    小的给左边,大的给右边,一样的话,根据isame来决定多少个中值放左边,多少个放右边。还有就是记得维护num,这个数组在查询时起到很大的作用。





接着是查询



[l,a-1]里被划到左边的元素个数,那么他一定在左子树的最左边,而我们要查的第k大元素绝不可能是这s0个元素里的,换句话说,这s0个元素不是在区间[a,b]里的,但又被划到了左子树,所以,新的查询区间的左极限可以是l+s0,即第k大元素至少在区间向右移动s0个单位上。那么右边极限怎么办? [a,b]里有s1个被划到左子树的,此时第k大元素定在这s1个元素中产生,所以右极限就是l+s0+s1-1。这之后的元素一定不要,所以区间就可以卡在这里。



if(s1 >= k)
    {
    	a=l+s0;
    	b=l+s0+s1-1;
    	return query(ind+1,l,mid,a,b,k);
    } 
 
else
    {
    	a=mid-l+1+a-s0;
    	b=mid-l+1+b-s0-s1;
    	return query(ind+1,mid+1,r,a,b,k-s1);
    }


下面的是POJ2761和NOJ1458的题解。



#include<stdio.h>
#include<algorithm>
#include<iostream>
#include<string.h>

using namespace std;

const int maxn=100011;

int sorted[maxn];

struct node
{
	int val[maxn];
	int num[maxn];
}tree[30];

void build(int ind,int l,int r)
{
	if(l == r)
	  return ;
    int mid=(l+r)>>1;
    int isame=mid-l+1,same=0;
    for(int i=l;i<=r;i++)
      if(sorted[mid] > tree[ind].val[i])
        isame--;
    int ln=l;
    int rn=mid+1;
    for(int i=l;i<=r;i++)
    {
    	if(l == i)
    	{
	    	tree[ind].num[i]=0;
	    }
	    else
	    {
    		tree[ind].num[i]=tree[ind].num[i-1];
    	}
    	if(tree[ind].val[i] > sorted[mid])
    	{
	    	tree[ind+1].val[rn++]=tree[ind].val[i];
	    }
	    else if(tree[ind].val[i] < sorted[mid])
	    {
    		tree[ind+1].val[ln++]=tree[ind].val[i];
    		tree[ind].num[i]++;
    	}
    	else
    	{
	    	if(isame >same)
	    	{
	    		same++;
	    		tree[ind+1].val[ln++]=tree[ind].val[i];
	    		tree[ind].num[i]++;
	    	}
	    	else
	    	{
	    		tree[ind+1].val[rn++]=tree[ind].val[i];
	    	}
	    }
    }
    build(ind+1,l,mid);
    build(ind+1,mid+1,r);
}

int query(int ind,int l,int r,int a,int b,int k)//在区间[a,b]里找第k大,现在在区间[l,r] 
{
	if(a == b)
	  return tree[ind].val[a];
    int s0,s1,mid=(l+r)>>1;
    if(a == l)
    {
    	s0=0;
    	s1=tree[ind].num[b];
    }
    else
    {
    	s0=tree[ind].num[a-1];
    	s1=tree[ind].num[b]-s0;
    }
    if(s1 >= k)
    {
    	a=l+s0;
    	b=l+s0+s1-1;
    	return query(ind+1,l,mid,a,b,k);
    }
    else
    {
    	a=mid-l+1+a-s0;
    	b=mid-l+1+b-s0-s1;
    	return query(ind+1,mid+1,r,a,b,k-s1);
    }
}

int main()
{
	int n,m;
	while(~scanf("%d%d",&n,&m))
	{
		for(int i=1;i<=n;i++)
		{
			scanf("%d",&tree[0].val[i]);
			sorted[i]=tree[0].val[i];
		}
		sort(sorted+1,sorted+n+1);
		build(0,1,n);
		int x,y,k;
		for(int i=0;i<m;i++)
		{
			scanf("%d%d%d",&x,&y,&k);
			printf("%d\n",query(0,1,n,x,y,k));
		}
	}
	return 0;
}