以計算斐波那契數列為例說說動態規划算法(Dynamic Programming Algorithm Overlapping subproblems Optimal substructure Memoization Tabulation)

來源:互聯網
上載者:User

標籤:雜湊   相加   公開課   algorithm   roc   blank   策略   就是   兩種   

動態規劃(Dynamic Programming)是求解決策過程(decision process)最佳化的數學方法。它的名字和動態沒有關係,是Richard Bellman為了唬人而取的。

 

動態規劃主要用於解決包含重疊子問題的最佳化問題,其基本策略是將原問題分解為相似的子問題,通過求解並儲存重複子問題的解,然後逐步合并成為原問題的解。動態規劃的關鍵是用記憶法儲存重複問題的答案,避免重複求解,以空間換取時間。

 

用動態規劃解決的經典問題有:最短路徑(shortest path),0-1背包問題(Knapsack problem),旅行商人問題(traveling sales person)等等。

(註:背包問題分為兩種:若物體不可分割,則稱為0-1背包問題,比如拿一塊金磚;若物體可以分開,則稱為一般背包問題,比如拿多少克大米。一般背包問題可以用貪心演算法解決。貪心演算法在每個階段即可找出當前最優解,每個階段的最優狀態都是由上一個階段的最優狀態得到的。)

 

可以採用動態規劃來求解的問題需要具有以下兩個主要特徵:

1)重疊子問題(Overlapping Subproblems):有些子問題會被重複計算多次。

2)最優子結構(Optimal Substructure):問題的最優解可以從某個子問題的最優解中獲得。

 

下面以計算斐波那契數列為例,看看動態規划算法的實現過程。

以下是1-5的斐波那契數列遞迴樹:

                         fib(5)                     /                            fib(4)                fib(3)             /      \                /              fib(3)      fib(2)         fib(2)    fib(1)        /     \        /    \       /      fib(2)   fib(1)  fib(1) fib(0) fib(1) fib(0)  /    fib(1) fib(0)

可以看出,fib(5)是由fib(4)和fib(3)相加而成,fib(4)則是由fib(3)和fib(2)相加而成,等等。其中,fib(3)要計算2次,fib(2)要計算3次。這裡面進行了很多重複的計算。

 

按之前部落格中提到的遞迴方法來計算這個斐波那契數列(用遞迴方法計算斐波那契數列),在此基礎上加入print("fib called with",n)語句後,看看fib函數的調用情況:

def fib(n):    print("fib called with",n)  #看調用了哪個fib函數,也就是說看計算了斐波那契數列的第幾項    if n<2:        return n    else:        return (fib(n-1) + fib(n-2))

 

計算一下斐波那契數列的第5項試試:

print(fib(5))

 

運行結果如下:

fib called with 5
fib called with 4
fib called with 3
fib called with 2
fib called with 1
fib called with 0
fib called with 1
fib called with 2
fib called with 1
fib called with 0
fib called with 3
fib called with 2
fib called with 1
fib called with 0
fib called with 1
5

 

可以看出一共進行了15次調用,其中fib(3)被計算了2次,fib(2)被計算了3次。

 

而使用動態規划算法來計算這個斐波那契數列,運行則會快一些。代碼如下:

def fastFib(n,memo):  #memo是設定的一個字典    print("fib1 called with",n)    if not n in memo:  #如果斐波那契數列的第n項數值不在字典裡,那麼用遞迴方式計算該值,並把該值放入字典中        memo[n]=fastFib(n-1,memo)+fastFib(n-2,memo)    return memo[n]   #如果斐波那契數列的第n項數值在字典裡,那麼直接返回字典裡的該項數值def fib1(n):    memo={0:0,1:1}  #初始化一個字典    return fastFib(n,memo)

 

同樣也計算一下斐波那契數列的第5項試試,運行結果如下:

fib1 called with 5
fib1 called with 4
fib1 called with 3
fib1 called with 2
fib1 called with 1
fib1 called with 0
fib1 called with 1
fib1 called with 2
fib1 called with 3
5

 

可以看出一共進行了9次調用,在進行過一次計算之後,後面的調用都是直接到字典裡去擷取該值即可。

 

具體來說,以上用動態規划算法來計算斐波那契數列的過程是這樣的:首先設定一個空數組,當需要子問題的解時,先去這個數組中尋找。如果此問題之前已經求過解,那麼就直接返回該值,如果此問題之前並未求過解,那麼就計算該值並把結果放入數組中,以備後用。

 

有兩種不同的方式來儲存這些數值:

1) 默記法(從上到下)/ Memoization (Top Down)

2) 表格法(從下到上)/ Tabulation (Bottom Up)

 

那麼到底應該用默記法還是表格法呢?

如果需要求解所有的子問題,那麼表格法往往要比默記法好。這是因為表格法沒有遞迴的額外消耗,並且使用預先分配好的數組(preallocated array),而不是雜湊圖(hash map)。

如果只是需要求解其中一些子問題,那麼默記法則要好些。

 

參考:麻省理工學院公開課:電腦科學及編程導論(第13集)

 

以計算斐波那契數列為例說說動態規划算法(Dynamic Programming Algorithm Overlapping subproblems Optimal substructure Memoization Tabulation)

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.