215. Kth Largest Element in an Array 数组中的第K个最大元素

原创

wx5e46005fc4d21 2021-08-10 10:05:02 ©著作权

文章标签 递归快速排序子数组数组时间复杂度 文章分类 后端开发

©著作权归作者所有：来自51CTO博客作者wx5e46005fc4d21的原创作品，请联系作者获取转载授权，否则将追究法律责任

Title

在未排序的数组中找到第 k 个最大的元素。请注意，你需要找的是数组排序后的第 k 个最大的元素，而不是第 k 个不同的元素。

示例 1:

输入: [3,2,1,5,6,4] 和 k = 2
输出: 5

示例 2:

输入: [3,2,3,1,2,4,5,5,6] 和 k = 4
输出: 4

说明:

你可以假设 k 总是有效的，且 1 ≤ k ≤ 数组的长度。

基于快速排序的选择方法

Solve

先对原数组排序，再返回倒数第k个位置，这样平均时间复杂度是O(nlogn)。

我们来回顾一下快速排序，对数组array[l…r]的快速排序过程是：

分解：将数组array[l…r]划分成两个子数组array[l…q-1]、array[q+1…r]，使得a[l…q-1]中的每个元素小于等于a[q]，且a[q]小于等于a[q+1…r]中的每个元素。
解决：通过递归调用快速排序，对子数组array[l…q-1]、array[q+1…r]进行排序。
合并：因为子数组都是原址排序，所以不需要进行合并操作，a[l…r]已经有序。

由此可以发现每次经过划分操作后，一定可以确定一个元素的最终位置，即x的最终位置为q，并且保证a[l…q-1]中的每个元素小于等于a[q]，且a[q]小于等于array[q+1…r]中的每个元素。

所以只要某次划分的q为倒数第k个下标的时候，就已经找到了答案，我们只关心这一点，至于array[l…q-1]、array[q+1…r]是否是有序的无需关心。

因此我们可以改进快速排序算法来解决这个问题：在分解的过程当中，我们会对子数组进行划分，如果划分得到的 q 正好就是我们需要的下标，就直接返回 a[q]；否则，如果 q 比目标下标小，就递归右子区间，否则递归左子区间。

这样就可以把原来递归两个区间变成只递归一个区间，提高了时间效率。这就是「快速选择」算法。

我们知道快速排序的性能和「划分」出的子数组的长度密切相关。直观地理解如果每次规模为 n 的问题我们都划分成 1 和 n - 1，每次递归的时候又向 n - 1 的集合中递归，这种情况是最坏的，时间代价是 O(n ²)。

我们可以引入随机化来加速这个过程，它的时间代价的期望是 O(n)，证明过程可以参考「《算法导论》9.2：期望为线性的选择算法」。

Code

	def findKthLargest_QuickSelection(self, nums: List[int], k: int) -> int:
		def quickSelect(a: List[int], l: int, r: int, k: int):
			q = randomPartition(a, l, r)
			return a[q] if q == k else quickSelect(a, q + 1, r, k) if q < k else quickSelect(a, l, q - 1, k)

		def partition(a: List[int], l: int, r: int):
			x, i = a[r], l - 1
			for j in range(l, r):
				if a[j] <= x:
					i += 1
					a[i], a[j] = a[j], a[i]
			a[i + 1], a[r] = a[r], a[i + 1]
			return i + 1

		def randomPartition(a: List[int], l: int, r: int):
			i = random.randint(l, r)
			a[i], a[r] = a[r], a[i]
			return partition(a, l, r)

		return quickSelect(nums, 0, len(nums) - 1, len(nums) - k)

复杂度分析

时间复杂度：O(n)，如上文所述，证明过程可以参考「《算法导论》9.2：期望为线性的选择算法」。

空间复杂度：O(logn)，递归使用栈空间的空间代价的期望为 O(logn)。

基于堆排序的选择方法

Solve

可以建立一个小根堆，做k-1次删除操作后堆顶元素就是我们要找的答案。

在很多语言中，都有优先队列或堆的容器可以直接使用，但在面试中，面试官更倾向于让面试者自己实现一个堆，搞懂「建堆」、「调整」和「删除」的过程。

取nums前k个元素建立大小为k的最小堆，剩余k+1到N个元素依次和堆顶比较，如果比堆顶大，则替换当前堆顶，并维护最小堆，最终最小堆里是前k大的元素，堆顶为前k大的元素中最小的元素。

Code

	def findKthLargest_MinimumHeap(self, nums: List[int], k: int) -> int:
		def shift(i, k):
			flag = 0
			while (i * 2 + 1) < k and flag == 0:
				t = i
				if nums[i] > nums[2 * i + 1]:
					t = 2 * i + 1
				if (i * 2 + 2) < k and nums[t] > nums[2 * i + 2]:
					t = 2 * i + 2
				if t == i:
					flag = 1
				else:
					nums[i], nums[t] = nums[t], nums[i]
					i = t

		for i in range(k // 2, -1, -1):
			shift(i, k)

		for i in range(k, len(nums)):
			if nums[0] < nums[i]:
				nums[0] = nums[i]
				shift(0, k)
		return nums[0]