@TOC
一、 题目
1. 题目形容
- 最长非凡序列 II
难度:中等
给定字符串列表 strs
,返回其中 最长的非凡序列 。如果最长非凡序列不存在,返回 -1
。
非凡序列 定义如下:该序列为某字符串 独有的子序列(即不能是其余字符串的子序列)。
s
的 子序列能够通过删去字符串 s
中的某些字符实现。
- 例如,
"abc"
是"aebdc"
的子序列,因为您能够删除"a<u>e</u>b<u>d</u>c"
中的下划线字符来失去"abc"
。"aebdc"
的子序列还包含"aebdc"
、"aeb"
和 <font face="Menlo, Monaco, Consolas, Courier New, monospace" color="#c7254e"><span style="font-size: 12.6px; background-color: rgb(249, 242, 244);">""</span></font> (空字符串)。
示例 1:
输出: strs = ["aba","cdc","eae"]输入: 3
示例 2:
输出: strs = ["aaa","aaa","aa"]输入: -1
提醒:
2 <= strs.length <= 50
1 <= strs[i].length <= 10
strs[i]
只蕴含小写英文字母
2. 原题链接
链接: 522. 最长非凡序列 II
二、 解题报告
1. 思路剖析
这题难就难在下边这个显然
上,剩下的都是套路。
先说一个显然:如果s的子序列ss是一个非凡序列,那么s更是非凡序列。
- 因而本题只须要判断每个字符串是否是其它字符串的子序列。
- 如果一个字符串不是任何一个其它字符串的子序列,这个字符串自身就是一个非凡序列,能够用来更新答案。
- 最初取所有非凡字符串的长度求max即可,没有就置-1.
子序列自动机
- 因为枚举每两个点对,因而对每个字符串,都要查看n-1个别的串是否是它的子序列(不剪枝的状况)。
- 对一个串屡次查看子序列的办法,能够用到子序列自动机。
- 判断子序列的奢侈办法是用双指针i,j。i在原串上,j在模式串上。咱们发现i向右挪动时,肯定优先取最近的(即最早呈现)、等于p[j]的字符,复每次最坏匹配复杂度 O(n+m)。
- 那么咱们能够用dp的形式预处理进去每个字符下一个字符最早呈现的地位,匹配时就能够间接i指针挪动到下一个合乎的字符,跳过大量无用比拟。
- 自动机结构复杂度 O(mc)*,c=26即为字典长度,m是原串长度。每次匹配复杂度为 O(n)。
参考我的题解Python子序列自动机做法
2. 复杂度剖析
- 显然枚举点对n^2是跑不了的。
- 设字符串均匀长度为m。
- 双指针做法复杂度 T(n) = O(n×n×2m)
- 自动机做法,每个字符串只须要结构一次自动机,消耗m×26,而后剩下n-1个串去匹配消耗m, 因而复杂度T(n) = O(n×(m×26+n×m)) = O(n×n×m+n×m×26)
- 次要复杂度仍然取决于外层n^2。
- 省的工夫不多 diff = n×n×m - n×m×26
3. 代码实现
子序列自动机
。
class SubSequenceAuto: def __init__(self,s,abc='abcdefghijklmnopqrstuvwxyz'): self.s,self.abc = s,abc self.n,abc_len = len(s),len(abc) self.abc_index = {v:k for k,v in enumerate(abc)} self.dp = [[self.n]*abc_len for _ in range(self.n+1)] dp = self.dp # dp.append([self.n]*abc_len) for i in range(self.n-1,-1,-1): dp[i] = dp[i+1][:] dp[i][self.abc_index[s[i]]] = i # for j in range(abc_len): # dp[i][j] = i if s[i]==abc[j] else dp[i+1][j] def query_is_sub_seq(self,t): dp = self.dp abc_index = self.abc_index n = self.n r = 0 for c in t: r = dp[r][abc_index[c]] if r == n: return False r += 1 return Trueclass Solution: def findLUSlength(self, strs: List[str]) -> int: """ 先说一个显然:如果s的子序列ss是一个非凡序列,那么s更是非凡序列。 因而本题只须要判断每个字符串是否是其它字符串的子序列。 判断子序列能够双指针,或者用子序列自动机。 """ n = len(strs) flags = [True] * n # 每个字符串是否是非凡序列,初始化为0。如果他是他人的子序列,则置False # 以下判断j是不是i的子序列 for i in range(n): sba = SubSequenceAuto(strs[i]) for j in range(n): if i == j or flags[j] ==False: continue if sba.query_is_sub_seq(strs[j]): flags[j] = False ans = -1 for i in range(n): if flags[i]: ans = max(ans,len(strs[i])) return ans
三、 本题小结
1) 子序列自动机的做法能够优化判断子序列的工夫,当字符串长度十分大时,劣势才显著。但这题数据较弱,因而劣势不显著。
2) 有工夫把子序列自动机模板写一下。
四、 参考链接
- 前置题: 392. 判断子序列
人生苦短,我用Python!