问题描述:
给出一个数列,找出其中最长的单调递减(或递增)子序列。
例如,{10,22,9,33,21,50,41,60,80}
LIS的长度是6和 LIS为{10,22,33,50,60,80}。
最优子结构:
对于长度为N的数组A[N] = {a0, a1, a2, …, an-1},假设假设我们想求以aj结尾的最大递增子序列长度,设为L[j],那么L[j] = max(L[i]) + 1, where i < j && a[i] < a[j], 也就是i的范围是0到j – 1。这样,想求aj结尾的最大递增子序列的长度,我们就需要遍历j之前的所有位置i(0到j-1),找出a[i] < a[j],计算这些i中,能产生最大L[i]的i,之后就可以求出L[j]。之后我对每一个A[N]中的元素都计算以他们各自结尾的最大递增子序列的长度,这些长度的最大值,就是我们要求的问题——数组A的最大递增子序列。
重叠子问题:
通过递归实现LIS
下边是递归树
- lis(4)
- / | \
- lis(3) lis(2) lis(1)
- / \ /
- lis(2) lis(1) lis(1)
- /
- lis(1)
有些重复的子问题被多次计算。所以我们可以使用memoization (记忆化存储)的或打表来避免同一子问题的重新计算。以下是打表方式实现的LIS,时间复杂度为O(n^2)。
- int list(int arr[],int n)
- {
- int i,j,max;
- max = 0;
- for(i=1;i<=n;i++)
- lis[i] = 1;
- for(i=2;i<=n;i++)
- {
- for(j=1;j<i;j++)
- {
- if(arr[i]>arr[j] && lis[i]<lis[j]+1)
- lis[i] = lis[j] + 1;
- }
- }
- for(i=1;i<=n;i++)
- if(max < lis[i])
- max = lis[i];
- return max;
- }
最长上升子序列nlogn算法
对于数组c的查找可使用二分查找,降低了整体的算法复杂度。时间复杂度为O(nlogn)。
假设存在一个序列d[1..9] = 2 1 5 3 6 4 8 9 7,可以看出来它的LIS长度为5。n
下面一步一步试着找出它。
我们定义一个序列B,然后令 i = 1 to 9 逐个考察这个序列。
此外,我们用一个变量Len来记录现在最长算到多少了
首先,把d[1]有序地放到B里,令B[1] = 2,就是说当只有1一个数字2的时候,长度为1的LIS的最小末尾是2。这时Len=1
然后,把d[2]有序地放到B里,令B[1] = 1,就是说长度为1的LIS的最小末尾是1,d[1]=2已经没用了,很容易理解吧。这时Len=1
接着,d[3] = 5,d[3]>B[1],所以令B[1+1]=B[2]=d[3]=5,就是说长度为2的LIS的最小末尾是5,很容易理解吧。这时候B[1..2] = 1, 5,Len=2
再来,d[4] = 3,它正好加在1,5之间,放在1的位置显然不合适,因为1小于3,长度为1的LIS最小末尾应该是1,这样很容易推知,长度为2的LIS最小末尾是3,于是可以把5淘汰掉,这时候B[1..2] = 1, 3,Len = 2
继续,d[5] = 6,它在3后面,因为B[2] = 3, 而6在3后面,于是很容易可以推知B[3] = 6, 这时B[1..3] = 1, 3, 6,还是很容易理解吧? Len = 3 了噢。
第6个, d[6] = 4,你看它在3和6之间,于是我们就可以把6替换掉,得到B[3] = 4。B[1..3] = 1, 3, 4, Len继续等于3
第7个, d[7] = 8,它很大,比4大,嗯。于是B[4] = 8。Len变成4了
第8个, d[8] = 9,得到B[5] = 9,嗯。Len继续增大,到5了。
最后一个, d[9] = 7,它在B[3] = 4和B[4] = 8之间,所以我们知道,最新的B[4] =7,B[1..5] = 1, 3, 4, 7, 9,Len = 5。
于是我们知道了LIS的长度为5。
!!!!! 注意。这个1,3,4,7,9不是LIS,它只是存储的对应长度LIS的最小末尾。有了这个末尾,我们就可以一个一个地插入数据。虽然最后一个d[9] = 7更新进去对于这组数据没有什么意义,但是如果后面再出现两个数字 8 和 9,那么就可以把8更新到d[5], 9更新到d[6],得出LIS的长度为6。
然后应该发现一件事情了:在B中插入数据是有序的,而且是进行替换而不需要挪动——也就是说,我们可以使用二分查找,将每一个数字的插入时间优化到O(logN)~~~~~于是算法的时间复杂度就降低到了O(NlogN)~!
- int stack[10010];
- int lis(int arr[],int n)
- {
- int i,top,mid,low,high;
- top = 0;
- stack[0] = -1;
- for(i=0;i<n;i++)
- {
- if(arr[i]>stack[top])
- stack[++top] = arr[i];
- else
- {
- low = 1;
- high = top;
- while(low <= high)
- {
- mid = (low + high)/2;
- if(arr[i] > stack[mid])
- low = mid + 1;
- else
- high = mid - 1;
- }
- stack[low] = arr[i];
- }
- }
- return top;
- }