動態規劃法
經常會遇到複雜問題不能簡單地分解成幾個子問題,而會分解出一系列的子問題。簡單地採用把大問題分解成子問題,並綜合子問題的解匯出大問題的解的方法,問題求解耗時會按問題規模呈冪級數增加。
為了節約重複求相同子問題的時間,引入一個數組,不管它們是否對最終解有用,把所有子問題的解存於該數組中,這就是動態規劃法所採用的基本方法。
【問題】 求兩字元序列的最長公用字元子序列
問題描述:字元序列的子序列是指從給定字元序列中隨意地(不一定連續)去掉若干個字元(可能一個也不去掉)後所形成的字元序列。令給定的字元序列X=“x0,x1,…,xm-1”,序列Y=“y0,y1,…,yk-1”是X的子序列,存在X的一個嚴格遞增下標序列<i0,i1,…,ik-1>,使得對所有的j=0,1,…,k-1,有xij=yj。例如,X=“ABCBDAB”,Y=“BCDB”是X的一個子序列。
考慮最長公用子序列問題如何分解成子問題,設A=“a0,a1,…,am-1”,B=“b0,b1,…,bm-1”,並Z=“z0,z1,…,zk-1”為它們的最長公用子序列。不難證明有以下性質:
(1) 如果am-1=bn-1,則zk-1=am-1=bn-1,且“z0,z1,…,zk-2”是“a0,a1,…,am-2”和“b0,b1,…,bn-2”的一個最長公用子序列;
(2) 如果am-1!=bn-1,則若zk-1!=am-1,蘊涵“z0,z1,…,zk-1”是“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一個最長公用子序列;
(3) 如果am-1!=bn-1,則若zk-1!=bn-1,蘊涵“z0,z1,…,zk-1”是“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一個最長公用子序列。
這樣,在找A和B的公用子序列時,如有am-1=bn-1,則進一步解決一個子問題,找“a0,a1,…,am-2”和“b0,b1,…,bm-2”的一個最長公用子序列;如果am-1!=bn-1,則要解決兩個子問題,找出“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一個最長公用子序列和找出“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一個最長公用子序列,再取兩者中較長者作為A和B的最長公用子序列。
求解:
引進一個二維數組c[][],用c[i][j]記錄X[i]與Y[j] 的LCS 的長度,b[i][j]記錄c[i][j]是通過哪一個子問題的值求得的,以決定搜尋的方向。
我們是自底向上進行遞推計算,那麼在計算c[i,j]之前,c[i-1][j-1],c[i-1][j]與c[i][j-1]均已計算出來。此時我們根據X[i] = Y[j]還是X[i] != Y[j],就可以計算出c[i][j]。
問題的遞迴式寫成:
回溯輸出最長公用子序列過程:
演算法分析:
由於每次調用至少向上或向左(或向上向左同時)移動一步,故最多調用(m * n)次就會遇到i = 0或j = 0的情況,此時開始返回。返回時與遞迴調用時方向相反,步數相同,故演算法時間複雜度為Θ(m * n)。
Java代碼實現:
[java] view plain copy public class LCSProblem { public static void main(String[] args) { //保留Null 字元串是為了getLength()方法的完整性也可以不保留 //但是在getLength()方法裡面必須額外的初始化c[][]第一個行第一列 String[] x = {"", "A", "B", "C", "B", "D", "A", "B"}; String[] y = {"", "B", "D", "C", "A", "B", "A"}; int[][] b = getLength(x, y); Display(b, x, x.length-1, y.length-1); } /** * @param x * @param y * @return 返回一個記錄決定搜尋的方向的數組 */ public static int[][] getLength(String[] x, String[] y) { int[][] b = new int[x.length][y.length]; int[][] c = new int[x.length][y.length]; for(int i=1; i<x.length; i++) { for(int j=1; j<y.length; j++) { //對應第一個性質 if( x[i] == y[j]) { c[i][j] = c[i-1][j-1] + 1; b[i][j] = 1; } //對應第二或者第三個性質 else if(c[i-1][j] >= c[i][j-1]) { c[i][j] = c[i-1][j]; b[i][j] = 0; } //對應第二或者第三個性質 else { c[i][j] = c[i][j-1]; b[i][j] = -1; } } } return b; } //回溯的基本實現,採取遞迴的方式 public static void Display(int[][] b, String[] x, int i, int j) { if(i == 0 || j == 0) return; if(b[i][j] == 1) { Display(b, x, i-1, j-1); System.out.print(x[i] + " "); } else if(b[i][j] == 0) { Display(b, x, i-1, j); } else if(b[i][j] == -1) { Display(b, x, i, j-1); } } }
最長公用子字串:類似最長子序列,只是公用子字串要求必須是連續的。
java實現代碼如下:
[java] view plain copy public class stringCompare { //在動態規劃矩陣產生方式當中,每產生一行,前面的那一行就已經沒有用了,因此這裡只需使用一維數組,而不是常用的二位元組 public static void getLCString(char[] str1, char[] str2) { int len1, len2; len1 = str1.length; len2 = str2.length; int maxLen = len1 > len2 ? len1 : len2; int[] max = new int[maxLen];// 儲存最長子串長度的數組 int[] maxIndex = new int[maxLen];// 儲存最長子串長度最大索引的數組 int[] c = new int[maxLen]; int i, j; for (i = 0; i < len2; i++) { for (j = len1 - 1; j >= 0; j--) { if (str2[i] == str1[j]) { if ((i == 0) || (j == 0)) c[j] = 1; else c[j] = c[j - 1] + 1;//此時C[j-1]還是上次迴圈中的值,因為還沒被重新賦值 } else { c[j] = 0; } // 如果是大於那暫時只有一個是最長的,而且要把後面的清0; if (c[j] > max[0]) { max[0] = c[j]; maxIndex[0] = j; for (int k = 1; k < maxLen; k++) { max[k] = 0; maxIndex[k] = 0; } } // 有多個是相同長度的子串 else if (c[j] == max[0]) { for (int k = 1; k < maxLen; k++) { if (max[k] == 0) { max[k] = c[j]; maxIndex[k] = j; break; // 在後面加一個就要退出迴圈了 } } } } for (int temp : c) { System.out.print(temp); } System.out.println(); } //列印最長子字串 &