对于最长公共子序列的动静布局算法剖析

示例引出：
- 给定序列$ X = \{A, B, C, B, D, A, B\} $和 $ Y = \{B, D, C, A, B, A\} $，要求找出它们的最长公共子序列。
什么是子序列？
- 简略来说，就是从某个给定的序列中，依照从左向右的程序提取出某些元素形成的序列。
- 那么对于上述示例中的$ X $来说，$ \{B, C, D, B\} $就是其中的一个子序列.
- 那么最长公共子序列就是求两个序列中最长雷同的子序列，对于上述示例来说，$ \{B,C,B,A\},\{B,D,A,B\},\{B,C,A,B\} $是两者的最长公共子序列。
构造剖析：
- 最长公共子序列具备最优子结构的性质：某个问题的最优解蕴含其子问题的最优解。
- 这里给出递推关系：
- 假如序列$ X_n=\{x_1, x_2,...,x_n\} $和序列$ Y_m=\{y_1,y_2,..,,y_m\} $，而两者的最长公共子序列$ Z_k=\{z_1,z_2,...,z_k\} $；
- 那么：
  - 当$ x_n=y_m $时，有$z_k=x_n=y_m$，$ z_{k-1} $为$ x_{n-1} $和$ y_{m-1} $的最长公共子序列；
  - 当$ x_n\neq y_m $且$ z_k=y_m $时，$ z_{k-1} $为$ x_n $和$ y_{m-1} $的最长公共子序列；
  - 当$ x_n\neq y_m $且$ z_k=x_n $时，$ z_{k-1} $为$ x_{n-1} $和$ y_{m} $的最长公共子序列.
- 能够给出递归关系：
  - 这里应用c[i][j]来存储序列$ X_i $和序列$ Y_j $的最长公共子序列，
  - $$c[i][j]=\begin{cases}0,\ \ i>0;\ j=0\\c[i-1][j-1]+1,\ \ i,j>0;\ x_i=y_j\\max(c[i-1][j],c[i][j-1]),\ \ i,j>0;\ x_i\neq y_j \end{cases}$$
  - 这里给出上述示例的最大长度计算图示，右边是长度数组，左边是标记数组：
  - 这里咱们能够看到，二维数组中最大值为4，阐明咱们的最长公共子序列的长度为4。
  - 而咱们能够记录下长度最大的坐标，并从此进行查问。
  - 如上图中左边的局部，对于(7, 6)来说，因为c[6][6] = c[7,5]，所以须要同时向上和向下查问，之后的依照如上规定查问即可。
  - 这里再给出另外一条查问线路，如下图：
  - 这里给出实现代码如下，为了防止反复编写比拟代码，这里应用了标记数组b[n+1][m+1]来批示回溯方向：
  - ```
  #include <iostream>#include <vector>using namespace std;const int maxn = 100;vector<int> temp;/*** @description: 获取最长公共子序列的长度* @param {int} n: 序列X的长度* @param {int} m: 序列Y的长度* @param {char*} x: 序列X，索引从1开始到n完结* @param {char*} y: 序列Y，索引从1开始到m完结* @param {int**} c: 长度二维数组, 大小为(m + 1) * (n + 1)* @param {int**} b: 标记二维数组, 大小为(m + 1) * (n + 1)* @return {int} 最长公共子序列的长度*/int Longest_Common_SubSequence_Length(int n, int m, char *x, char *y, int **c, int **b){     for(int i = 0; i <= n; i++)  {    c[i][0] = 0;  }  for(int j = 0; j <= m; j++)  {    c[0][j] = 0;  }  for(int i = 1; i <= n; i++)  {    for(int j = 1; j <= m; j++)    {      if(x[i] == y[j])      {        c[i][j] = c[i-1][j-1] + 1;        b[i][j] = 1;      }      else if(c[i][j-1] > c[i-1][j])      {        c[i][j] = c[i][j-1];        b[i][j] = 2;      }      else if(c[i][j-1] < c[i-1][j])      {        c[i][j] = c[i-1][j];        b[i][j] = 3;      }      else if(c[i][j-1] == c[i-1][j])      {        c[i][j] = c[i-1][j];        b[i][j] = 4;      }    }  }  return c[n][m];}/** * @description: 输入最长公共子序列 * b[i][j] = 1, 入栈，再向(i-1, j-1)查找 * b[i][j] = 2, 向(i, j-1)查找 * b[i][j] = 3, 向(i-1, j)查找 * b[i][j] = 4, 向(i-1, j)和(i, j-1)同时查找 */void LCS(char *x, int **b, int i, int j, int longest){  if(i == 0 || j == 0)  {    if(temp.size() == longest)    {      for(int i = temp.size() - 1; i >= 0; i--)      {        printf("%c ",x[temp[i]]);      }      printf("\n");    }    return ;  }  if(b[i][j] == 1)  {    temp.push_back(i);    LCS(x, b, i-1, j-1, longest);    temp.pop_back();  }  else if(b[i][j] == 2)  {    LCS(x, b, i, j-1, longest);  }  else if(b[i][j] == 3)  {    LCS(x, b, i-1, j, longest);  }  else  {    LCS(x, b, i-1, j, longest);    LCS(x, b, i, j-1, longest);  }}int main(void){  int n, m;  int **c, **b;  char x[maxn], y[maxn];  scanf("%d%d", &n, &m);  c = (int **) malloc(sizeof(int*) * (n+1));  b = (int **) malloc(sizeof(int*) * (n+1));  for(int i = 0; i <= n; i++)  {    c[i] = (int *)malloc(sizeof(int) * (m+1));    b[i] = (int *)malloc(sizeof(int) * (m+1));  }  scanf("%s",(x+1));  scanf("%s",(y+1));    Longest_Common_SubSequence_Length(n, m, x, y, c, b);  LCS(x, b, n, m, c[n][m]);}
```
- 输出测试：
```
    7 6  ABCBDAB  BDCABA
```
- 输入后果：
```
  B C B A B C A B B D A B
```
- 算法复杂度剖析：
- 计算最长公共子序列长度：在int Longest_Common_SubSequence_Length(int n, int m, char *x, char *y, int **c, int **b)中，对于每个单元c[i][j]来说，计算消耗工夫为$ O(1) $，总计工夫复杂度为$ O(n*m) $。
- 获取最长公共子序列：在void LCS(char *x, int **b, int i, int j, int longest)中回溯寻找某一个最大公共子序列的比拟次数最大为m+n，工夫复杂度为$ O(n+m) $。
- 这里咱们应用了标记数组来防止反复编写比拟代码，咱们也能够不应用标记数组，这样能够节俭肯定的空间。同时，如果咱们只是为了失去最长公共子序列的长度，咱们能够将空间复杂度缩小到$ O(min(n,m)) $，因为在之前的计算中能够发现，咱们只须要保留数组c中的第$ i $行和第$ i-1 $行的数据即可。