关于数据结构与算法:字符串KMP算法字符串哈希

KMP算法

利用场景

KMP算法个别用于字符串匹配问题
例如：给出两个字串S，P须要判断P串是否为S串的子串

前缀表

前缀：蕴含第一个字符不蕴含最初一个字符
后缀：蕴含最初一个字符不蕴含最初一个字符
例如：aaba
前缀别离为：a, aa, aab
后缀别离为：a, ba, aba
最长相等前后缀：记录前缀和后缀相等的长度，在这个例子中最长相等前后缀为a，长度为1
在KMP算法当中，用一个next数组记录每个字符的最长相等前后缀
例如：aabaa
前缀别离为：a, aa, aab, aaba
后缀别离为：a, aa, baa, abaa
next数组为：a:0, aa:1, aab:0, aaba:1, aabaa:2
next = [0, 1, 0, 1, 2]

前缀表在KMP算法中的作用

暴力解法中，咱们须要两重循环遍历P串和S串，直到找到匹配的字串，工夫复杂度为O(n*m)，n，m别离示意P串和S串的长度
KMP算法的核心思想就是用前缀表记录曾经匹配过的文本内容，使得当产生匹配抵触的时候，能够不须要从新遍历，而是通过前缀表回退到之前匹配胜利过的地位持续匹配，next数组就是前缀表
具体原理参考https://www.bilibili.com/vide…

next数组的实现（前缀表实现）

结构next数组分为四步：
初始化
定义两个指针i，j
j指向前缀开端地位，i指向后缀开端地位
next数组初始化为0，j从0开始，i从1开始
解决前后缀不雷同的状况
以后后缀不相等并且j>0时（后续要回退到j-1的状态所以要保障j>0）
j回退到j-1的状态
解决前后缀雷同的状况
前后缀雷同时，j向后挪动一位
更新next数组
将next数组更新为j

代码模板

int j = 0;
next[0] = 0;
for (int i = 1; i < m; i ++){
  while (j > 0 && s[i] != s[j]) j = next[j - 1];
  if (s[i] == s[j]) j ++;
  next[i] = j;
}

leetcode.28

链接https://leetcode.cn/problems/…

leetcode解题代码

class Solution {
public:
  int strStr(string haystack, string needle) {
      int n = haystack.length(), m = needle.length();
      vector<int> next(m);
      int j = 0;// 初始化j
      next[0] = 0;// 初始化next数组
      for (int i = 1; i < m; i ++){// 初始化i
          while (j > 0 && needle[i] != needle[j]) j = next[j - 1];// 前后缀不雷同时
          if (needle[i] == needle[j]) j ++;// 前后缀雷同时
          next[i] = j;// 更新next数组
      }

      j = 0;
      for (int i = 0; i < haystack.size(); i++) {
          while(j > 0 && haystack[i] != needle[j]) j = next[j - 1];
          if (haystack[i] == needle[j]) j++;
          if (j == needle.size() ) {
              return (i - needle.size() + 1);
          }
      }
      return -1;
  }
};

leetcode.459

链接https://leetcode.cn/problems/…

leetcode解题代码

class Solution {
public:
  bool repeatedSubstringPattern(string s) {
      int n = s.size();
      vector<int> next(n);
      int j = 0;
      next[0] = 0;
      for (int i = 1; i < n; i ++){
          while (j > 0 && s[i] != s[j]) j = next[j - 1];
          if (s[i] == s[j]) j ++;
          next[i] = j;
      }
      return next[n - 1] != 0 && n % (n - next[n - 1]) == 0;
  }
};

字符串前缀哈希

利用场景

求两个字符串的子串是否雷同

利用办法

字符串的映射
例如：有一个’abcdefgycr’的字符串，将其映射成某个哈希值并用数组h存下来
h[n]示意字符串第n位的哈希值
h[0]=0，h[1]=’a’的哈希值，h[2]=’ab’的哈希值…
哈希值的定义
例如：字符串’abcd’的哈希值是多少呢？
咱们把’abcd’看成p进制的数，那么’abcd’则能够示意为
a*p^3+b*p^2+c*p^1+d*p^0
然而这样映射的值可能过大，所以咱们再将其取模q
这样就能够将字符串映射到0~q-1之间
个别状况下p=131，q=2^64，能够假设不会产生哈希抵触>.<（感兴趣的能够查一下）
定义一个区间[L, R]的哈希值
通过上述形式咱们曾经晓得了h[L-1]和h[R]
通过h[R] – h[L-1]*p^(R-L+1)

实现办法

typedef unsigned long long ULL;// 能够省略取模的步骤了

const int P = 131;

ULL h[N], p[N];

// 初始化
p[0] = 1;// p^0 = 1
h[0] = 0;
// 前缀和定义前缀字符串哈希
for (int i = 1; i <= n; i ++){
    h[i] = h[i - 1] * P + str[i];
    p[i] = p[i - 1] * P;
}
// 计算字串[L, R]的哈希值
ULL get(int l, int r){
    return h[r] - h[l - 1] * p[r - l + 1];
}

leetcode.796

链接https://leetcode.cn/problems/…
解题思路：求两个字符串的哈希值，比拟对应段是否相等
为了不必求解两次字符串哈希，能够将两个字符串拼接

leetcode解题代码

typedef unsigned long long ULL;

const int N = 210, P = 131;
ULL h[N], p[N];

class Solution {
public:
  ULL get(int l, int r) {
      return h[r] - h[l - 1] * p[r - l + 1];
  }

  bool rotateString(string A, string B) {
      if (A.size() != B.size()) return false;
      string s = ' ' + A + B;
      int n = s.size() - 1;
      p[0] = 1;
      for (int i = 1; i <= n; i ++ ) {
          p[i] = p[i - 1] * P;
          h[i] = h[i - 1] * P + s[i];
      }

      for (int k = 1; k < A.size(); k ++ )
          if (get(1, k) == get(n - k + 1, n) && get(k + 1, A.size()) == get(A.size() + 1, n - k))
              return true;
      return false;
  }
};

解题参考：https://www.acwing.com/
刷题程序参考：https://www.programmercarl.com/

关于数据结构与算法:字符串KMP算法字符串哈希

KMP算法

利用场景

前缀表

前缀表在KMP算法中的作用

next数组的实现（前缀表实现）

leetcode.28

leetcode.459

字符串前缀哈希

利用场景

利用办法

实现办法

leetcode.796

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于数据结构与算法:字符串KMP算法字符串哈希

KMP算法

利用场景

前缀表

前缀表在KMP算法中的作用

next数组的实现（前缀表实现）

leetcode.28

leetcode.459

字符串前缀哈希

利用场景

利用办法

实现办法

leetcode.796

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复