关于算法:算法DP之最长公共子序列

最长公共子序列

1.问题形容

$对于母串X=<x1,x2,⋯,xm>, Y=<y1,y2,⋯,yn>,求最长公共子序列$

2.求解算法

2.1 暴力破解

$假如m<n ,对于母串X,能够找到2^m-1个子序列,而后顺次在母串Y中匹配,算法的工夫复杂度会达到指数级O(n * 2^m)$

2.2 动静布局

最优子结构:
$假如Z=<z1,z2,⋯,zk>是XX与YY的LCS, 咱们察看到 $

  • $如果xm=yn,则zk=xm=yn,有Zk−1是Xm−1与Yn−1的LCS;$
  • $如果xm≠yn,则Zk是Xm与Yn−1的LCS,或者是Xm−1与Yn的LCS。$

因而,求解LCS的问题则变成递归求解的两个子问题。然而,上述的递归求解的方法中,反复的子问题多,效率低下。改良的方法——用空间换工夫,用数组保留中间状态,不便前面的计算,这就是动静布局(DP)的核心思想了。
用二维数组ci记录串x1x2⋯xi与y1y2⋯yj的LCS长度,则可失去状态转移方程

状态转移方程

JAVA代码递归实现

public static int lcs(String s1, String s2) {
  char[][] c = new char[s1.length() + 1][s2.length() + 1];
  for (int i = 1; i <= s1.length(); i++) {
    c[i][0] = s1.charAt(i - 1);
  }
  for (int j = 1; j <= s2.length(); j++) {
    c[0][j] = s2.charAt(j - 1);
  }
  return recursion(c, s1.length(), s2.length());
}
public static int recursion(char[][] c, int i, int j) {
  if (i == 0 || j == 0) {
    return 0;
  }
  if (c[i][1] == c[1][j]) {
    return recursion(c, i - 1, j - 1) + 1;
  } 
  return Math.max(recursion(c, i, j - 1), recursion(c, i - 1, j));
}

JAVA代码自底向上动静布局实现

public static int lcs(String s1, String s2) {
  char[][] c = new char[s1.length() + 1][s2.length() + 1];
  int[][] dp = new int[s1.length() + 1][s2.length() + 1];
  // s1,s2字符串转二维数组
 for (int i = 1; i <= s1.length(); i++) {
    c[i][0] = s1.charAt(i - 1);
  }
  for (int j = 1; j <= s2.length(); j++) {
    c[0][j] = s2.charAt(j - 1);
  }
  // 初始化dp数组
 for (int i = 0; i <= s1.length(); i++) {
    dp[i][0] = 0;
  }
  for (int j = 0; j < s2.length(); j++) {
    dp[0][j] = 0;
  }
  // 填表
 for (int i = 1; i <= s1.length(); i++) {
    for (int j = 1; j <= s2.length(); j++) {
      if (c[i][0] == c[0][j]) {
        dp[i][j] = dp[i - 1][j - 1] + 1;
      } else {
        dp[i][j] = Math.max(dp[i - 1][j], dp[i][j - 1]);
      }
    }
  }
  return dp[s1.length()][s2.length()];
}

参考文献:
【动静布局】最长公共子序列与最长公共子串
动静布局 最长公共子序列 过程图解
动静布局解最长公共子序列(LCS)(附具体填表过程)
《算法导论》第四局部 高级设计和剖析技术

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理