215. Kth Largest Element in an Array 数组中的第K个最大元素
Title
在未排序的數組中找到第 k 個最大的元素。請注意,你需要找的是數組排序后的第 k 個最大的元素,而不是第 k 個不同的元素。
示例 1:
輸入: [3,2,1,5,6,4] 和 k = 2
輸出: 5
示例 2:
輸入: [3,2,3,1,2,4,5,5,6] 和 k = 4
輸出: 4
說明:
你可以假設 k 總是有效的,且 1 ≤ k ≤ 數組的長度。
基于快速排序的選擇方法
Solve
先對原數組排序,再返回倒數第k個位置,這樣平均時間復雜度是O(nlogn)。
我們來回顧一下快速排序,對數組array[l…r]的快速排序過程是:
分解:將數組array[l…r]劃分成兩個子數組array[l…q-1]、array[q+1…r],使得a[l…q-1]中的每個元素小于等于a[q],且a[q]小于等于a[q+1…r]中的每個元素。
解決:通過遞歸調用快速排序,對子數組array[l…q-1]、array[q+1…r]進行排序。
合并:因為子數組都是原址排序,所以不需要進行合并操作,a[l…r]已經有序。
由此可以發現每次經過劃分操作后,一定可以確定一個元素的最終位置,即x的最終位置為q,并且保證a[l…q-1]中的每個元素小于等于a[q],且a[q]小于等于array[q+1…r]中的每個元素。
所以只要某次劃分的q為倒數第k個下標的時候,就已經找到了答案,我們只關心這一點,至于array[l…q-1]、array[q+1…r]是否是有序的無需關心。
因此我們可以改進快速排序算法來解決這個問題:在分解的過程當中,我們會對子數組進行劃分,如果劃分得到的 q 正好就是我們需要的下標,就直接返回 a[q];否則,如果 q 比目標下標小,就遞歸右子區間,否則遞歸左子區間。
這樣就可以把原來遞歸兩個區間變成只遞歸一個區間,提高了時間效率。這就是「快速選擇」算法。
我們知道快速排序的性能和「劃分」出的子數組的長度密切相關。直觀地理解如果每次規模為 n 的問題我們都劃分成 1 和 n - 1,每次遞歸的時候又向 n - 1 的集合中遞歸,這種情況是最壞的,時間代價是 O(n 2)。
我們可以引入隨機化來加速這個過程,它的時間代價的期望是 O(n),證明過程可以參考「《算法導論》9.2:期望為線性的選擇算法」。
Code
def findKthLargest_QuickSelection(self, nums: List[int], k: int) -> int:def quickSelect(a: List[int], l: int, r: int, k: int):q = randomPartition(a, l, r)return a[q] if q == k else quickSelect(a, q + 1, r, k) if q < k else quickSelect(a, l, q - 1, k)def partition(a: List[int], l: int, r: int):x, i = a[r], l - 1for j in range(l, r):if a[j] <= x:i += 1a[i], a[j] = a[j], a[i]a[i + 1], a[r] = a[r], a[i + 1]return i + 1def randomPartition(a: List[int], l: int, r: int):i = random.randint(l, r)a[i], a[r] = a[r], a[i]return partition(a, l, r)return quickSelect(nums, 0, len(nums) - 1, len(nums) - k)復雜度分析
時間復雜度:O(n),如上文所述,證明過程可以參考「《算法導論》9.2:期望為線性的選擇算法」。
空間復雜度:O(logn),遞歸使用棧空間的空間代價的期望為 O(logn)。
基于堆排序的選擇方法
Solve
可以建立一個小根堆,做k-1次刪除操作后堆頂元素就是我們要找的答案。
在很多語言中,都有優先隊列或堆的容器可以直接使用,但在面試中,面試官更傾向于讓面試者自己實現一個堆,搞懂「建堆」、「調整」和「刪除」的過程。
取nums前k個元素建立大小為k的最小堆,剩余k+1到N個元素依次和堆頂比較,如果比堆頂大,則替換當前堆頂,并維護最小堆,最終最小堆里是前k大的元素,堆頂為前k大的元素中最小的元素。
Code
def findKthLargest_MinimumHeap(self, nums: List[int], k: int) -> int:def shift(i, k):flag = 0while (i * 2 + 1) < k and flag == 0:t = iif nums[i] > nums[2 * i + 1]:t = 2 * i + 1if (i * 2 + 2) < k and nums[t] > nums[2 * i + 2]:t = 2 * i + 2if t == i:flag = 1else:nums[i], nums[t] = nums[t], nums[i]i = tfor i in range(k // 2, -1, -1):shift(i, k)for i in range(k, len(nums)):if nums[0] < nums[i]:nums[0] = nums[i]shift(0, k)return nums[0]復雜度分析
時間復雜度:O(nlogn),建堆的時間代價是 O(n),刪除的總代價是 O(klogn),因為 k<n,故漸進時間復雜為 O(n+klogn)=O(nlogn)。
空間復雜度:O(logn),即遞歸使用棧空間的空間代價。
總結
以上是生活随笔為你收集整理的215. Kth Largest Element in an Array 数组中的第K个最大元素的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 209. Minimum Size Su
- 下一篇: 718. Maximum Length