DTStructure分治法与最大子列和问题
【本文為引用自 https://www.cnblogs.com/conw/p/5896155.html 的文章,感謝作者】
最大連續子數列和一道很經典的算法問題,給定一個數列,其中可能有正數也可能有負數,我們的任務是找出其中連續的一個子數列(不允許空序列),使它們的和盡可能大。我們一起用多種方式,逐步優化解決這個問題。
為了更清晰的理解問題,首先我們先看一組數據:
8
-2 6 -1 5 4 -7 2 3
第一行的8是說序列的長度是8,然后第二行有8個數字,即待計算的序列。
對于這個序列,我們的答案應該是14,所選的數列是從第2個數到第5個數,這4個數的和是所有子數列中最大的。
最暴力的做法,復雜度O(N^3)
暴力求解也是容易理解的做法,簡單來說,我們只要用兩層循環枚舉起點和終點,這樣就嘗試了所有的子序列,然后計算每個子序列的和,然后找到其中最大的即可,C語言代碼如下:
復制代碼
#include <stdio.h>
//N是數組長度,num是待計算的數組,放在全局區是因為可以開很大的數組
int N, num[1024];
int main()
{
//輸入數據
scanf("%d", &N);
for(int i = 1; i <= N; i++)
scanf("%d", &num[i]);
}
復制代碼
這個算法的時間復雜度是O(N^3),復雜度的計算方法可參考《算法導論》第一章,如果我們的計算機可以每秒計算一億次的話,這個算法在一秒內只能計算出500左右長度序列的答案。
一個簡單的優化
如果你讀懂了剛才的程序,我們可以來看一個簡單的優化。
如果我們有這樣一個數組sum,sum[i]表示第1個到第i個數的和。那么我們如何快速計算第i個到第j個這個序列的和?對,只要用sum[j] - sum[i-1]就可以了!這樣的話,我們就可以省掉最內層的循環,讓我們的程序效率更高!C語言代碼如下:
復制代碼
#include <stdio.h>
//N是數組長度,num是待計算的數組,sum是數組前綴和,放在全局區是因為可以開很大的數組
int N, num[16384], sum[16384];
int main()
{
//輸入數據
scanf("%d", &N);
for(int i = 1; i <= N; i++)
scanf("%d", &num[i]);
}
復制代碼
這個算法的時間復雜度是O(N^2)。如果我們的計算機可以每秒計算一億次的話,這個算法在一秒內能計算出10000左右長度序列的答案,比之前的程序已經有了很大的提升!此外,我們在這個程序中創建了一個sum數組,事實上,這也是不必要的,我們我就也可以把數組前綴和直接計算在num數組中,這樣可以節約一些內存。
換個思路,繼續優化
你應該聽說過分治法,正是:分而治之。我們有一個很復雜的大問題,很難直接解決它,但是我們發現可以把問題劃分成子問題,如果子問題規模還是太大,并且它還可以繼續劃分,那就繼續劃分下去。直到這些子問題的規模已經很容易解決了,那么就把所有的子問題都解決,最后把所有的子問題合并,我們就得到復雜大問題的答案了??赡苷f起來簡單,但是仍不知道怎么做,接下來分析這個問題:
首先,我們可以把整個序列平均分成左右兩部分,答案則會在以下三種情況中:
1、所求序列完全包含在左半部分的序列中。
2、所求序列完全包含在右半部分的序列中。
3、所求序列剛好橫跨分割點,即左右序列各占一部分。
前兩種情況和大問題一樣,只是規模小了些,如果三個子問題都能解決,那么答案就是三個結果的最大值。我們主要研究一下第三種情況如何解決:
我們只要計算出:以分割點為起點向左的最大連續序列和、以分割點為起點向右的最大連續序列和,這兩個結果的和就是第三種情況的答案。因為已知起點,所以這兩個結果都能在O(N)的時間復雜度能算出來。
遞歸不斷減小問題的規模,直到序列長度為1的時候,那答案就是序列中那個數字。
綜上所述,C語言代碼如下,遞歸實現:
復制代碼
#include <stdio.h>
//N是數組長度,num是待計算的數組,放在全局區是因為可以開很大的數組
int N, num[16777216];
int solve(int left, int right)
{
//序列長度為1時
if(left == right)
return num[left];
}
int main()
{
//輸入數據
scanf("%d", &N);
for(int i = 1; i <= N; i++)
scanf("%d", &num[i]);
}
復制代碼
不難看出,這個算法的時間復雜度是O(N*logN)的(想想歸并排序)。它可以在一秒內處理百萬級別的數據,甚至千萬級別也不會顯得很慢!這正是算法的優美之處。對遞歸不太熟悉的話可能會對這個算法有所疑惑,那可就要仔細琢磨一下了。
動態規劃的魅力,O(N)解決!
很多動態規劃算法非常像數學中的遞推。我們如果能找到一個合適的遞推公式,就能很容易的解決問題。
我們用dp[n]表示以第n個數結尾的最大連續子序列的和,于是存在以下遞推公式:
dp[n] = max(0, dp[n-1]) + num[n]
仔細思考后不難發現這個遞推公式是正確的,則整個問題的答案是max(dp[m]) | m∈[1, N]。C語言代碼如下:
復制代碼
#include <stdio.h>
//N是數組長度,num是待計算的數組,放在全局區是因為可以開很大的數組
int N, num[134217728];
int main()
{
//輸入數據
scanf("%d", &N);
for(int i = 1; i <= N; i++)
scanf("%d", &num[i]);
}
復制代碼
這里我們沒有創建dp數組,根據遞歸公式的依賴關系,單獨一個num數組就足以解決問題,創建一個一億長度的數組要占用幾百MB的內存!這個算法的時間復雜度是O(N)的,所以它計算一億長度的序列也不在話下!不過你如果真的用一個這么大規模的數據來測試這個程序會很慢,因為大量的時間都耗費在程序讀取數據上了!
另辟蹊徑,又一個O(N)的算法
考慮我們之前O(N^2)的算法,即一個簡單的優化一節,我們還有沒有辦法優化這個算法呢?答案是肯定的!
我們已知一個sum數組,sum[i]表示第1個數到第i個數的和,于是sum[j] - sum[i-1]表示第i個數到第j個數的和。
那么,以第n個數為結尾的最大子序列和有什么特點?假設這個子序列的起點是m,于是結果為sum[n] - sum[m-1]。并且,sum[m]必然是sum[1],sum[2]...sum[n-1]中的最小值!這樣,我們如果在維護計算sum數組的時候,同時維護之前的最小值, 那么答案也就出來了!為了節省內存,我們還是只用一個num數組。C語言代碼如下:
復制代碼
#include <stdio.h>
//N是數組長度,num是待計算的數組,放在全局區是因為可以開很大的數組
int N, num[134217728];
int main()
{
//輸入數據
scanf("%d", &N);
for(int i = 1; i <= N; i++)
scanf("%d", &num[i]);
}
復制代碼
看起來我們已經把最大連續子序列和的問題解決得很完美了,時間復雜度和空間復雜度都是O(N),不過,我們確實還可以繼續!
大道至簡,最大連續子序列和問題的完美解決
很顯然,解決此問題的算法的時間復雜度不可能低于O(N),因為我們至少要算出整個序列的和,不過如果空間復雜度也達到了O(N),就有點說不過去了,讓我們把num數組也去掉吧!
復制代碼
#include <stdio.h>
int main()
{
int N, n, s, ans, m = 0;
}
復制代碼
這個程序的原理和另辟蹊徑,又一個O(N)的算法中介紹的一樣,在計算前綴和的過程中維護之前得到的最小值。它的時間復雜度是O(N),空間復雜度是O(1),這達到了理論下限!唯一比較麻煩的是ans的初始化值,不能直接初始化為0,因為數列可能全為負數!
至此,最大連續子序列和的問題已經被我們完美解決!然而以上介紹的算法都只是直接求出問題的結果,而不能求出具體是哪一個子序列,其實搞定這個問題并不復雜,具體怎么做留待讀者思考吧!
轉載于:https://blog.51cto.com/maugham/2084676
總結
以上是生活随笔為你收集整理的DTStructure分治法与最大子列和问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AES加密算法动画演示
- 下一篇: 微软一站式示例代码库 2012 年2月示