乐趣区

关于python:LeetCode解题报告-522-最长特殊序列-II

@TOC

一、题目

1. 题目形容

  1. 最长非凡序列 II

难度:中等

给定字符串列表 strs,返回其中 最长的非凡序列。如果最长非凡序列不存在,返回 -1

非凡序列 定义如下:该序列为某字符串 独有的子序列(即不能是其余字符串的子序列)

s子序列 能够通过删去字符串 s 中的某些字符实现。

  • 例如,"abc""aebdc" 的子序列,因为您能够删除 "a<u>e</u>b<u>d</u>c" 中的下划线字符来失去 "abc""aebdc"的子序列还包含"aebdc""aeb" 和 <font face=”Menlo, Monaco, Consolas, Courier New, monospace” color=”#c7254e”><span style=”font-size: 12.6px; background-color: rgb(249, 242, 244);”>””</span></font> (空字符串)。

示例 1:

输出: strs = ["aba","cdc","eae"]
输入: 3

示例 2:

输出: strs = ["aaa","aaa","aa"]
输入: -1

提醒:

  • 2 <= strs.length <= 50
  • 1 <= strs[i].length <= 10
  • strs[i] 只蕴含小写英文字母

2. 原题链接

链接: 522. 最长非凡序列 II

二、解题报告

1. 思路剖析

这题难就难在下边这个 显然 上,剩下的都是套路。

先说一个显然:如果 s 的子序列 ss 是一个非凡序列,那么 s 更是非凡序列。
  • 因而本题只须要判断每个字符串是否是其它字符串的子序列。
  • 如果一个字符串不是任何一个其它字符串的子序列,这个字符串自身就是一个非凡序列,能够用来更新答案。
  • 最初取所有非凡字符串的长度求 max 即可,没有就置 -1.
子序列自动机
  • 因为枚举每两个点对,因而对每个字符串,都要查看 n - 1 个别的串是否是它的子序列(不剪枝的状况)。
  • 对一个串屡次查看子序列的办法,能够用到子序列自动机。
  • 判断子序列的奢侈办法是用双指针 i,j。i 在原串上,j 在模式串上。咱们发现 i 向右挪动时,肯定优先取最近的 (即最早呈现)、等于 p[j] 的字符,复每次最坏匹配复杂度 O(n+m)。
  • 那么咱们能够用 dp 的形式预处理进去每个字符下一个字符最早呈现的地位,匹配时就能够间接 i 指针挪动到下一个合乎的字符,跳过大量无用比拟。
  • 自动机结构复杂度 O(mc)*,c=26 即为字典长度,m 是原串长度。每次匹配复杂度为 O(n)。
  • 参考我的题解 Python 子序列自动机做法

    2. 复杂度剖析

  • 显然枚举点对 n^2 是跑不了的。
  • 设字符串均匀长度为 m。
  • 双指针做法复杂度 T(n) = O(n×n×2m)
  • 自动机做法,每个字符串只须要结构一次自动机,消耗 m×26, 而后剩下 n - 1 个串去匹配消耗 m,因而复杂度 T(n) = O(n×(m×26+n×m)) = O(n×n×m+n×m×26)
  • 次要复杂度仍然取决于外层 n^2。
  • 省的工夫不多 diff = n×n×m – n×m×26

3. 代码实现

子序列自动机

class SubSequenceAuto:
    def __init__(self,s,abc='abcdefghijklmnopqrstuvwxyz'):
        self.s,self.abc = s,abc
        self.n,abc_len = len(s),len(abc)
        self.abc_index = {v:k for k,v in enumerate(abc)}
        self.dp = [[self.n]*abc_len for _ in range(self.n+1)]
        dp = self.dp
        # dp.append([self.n]*abc_len)
        for i in range(self.n-1,-1,-1):
            dp[i] = dp[i+1][:]
            dp[i][self.abc_index[s[i]]] = i
            # for j in range(abc_len):
            #     dp[i][j] = i if s[i]==abc[j] else dp[i+1][j] 
    def query_is_sub_seq(self,t):
        dp = self.dp
        abc_index = self.abc_index
        n = self.n
        r = 0
        for c in t:
            r = dp[r][abc_index]
            if r == n:
                return False
            r += 1
        return True
class Solution:
    def findLUSlength(self, strs: List[str]) -> int:
        """
        先说一个显然:如果 s 的子序列 ss 是一个非凡序列,那么 s 更是非凡序列。因而本题只须要判断每个字符串是否是其它字符串的子序列。判断子序列能够双指针,或者用子序列自动机。"""
        n = len(strs)
        flags = [True] * n  # 每个字符串是否是非凡序列,初始化为 0。如果他是他人的子序列,则置 False
        # 以下判断 j 是不是 i 的子序列
        for i in range(n):
            sba = SubSequenceAuto(strs[i])
            for j in range(n):
                if i == j or flags[j] ==False:
                    continue
                if sba.query_is_sub_seq(strs[j]):
                    flags[j] = False 
        
        ans = -1
        for i in range(n):
            if flags[i]:
                ans = max(ans,len(strs[i]))
        return ans

三、本题小结

1) 子序列自动机的做法能够优化判断子序列的工夫,当字符串长度十分大时,劣势才显著。但这题数据较弱,因而劣势不显著。

2) 有工夫把子序列自动机模板写一下。

四、参考链接

  • 前置题: 392. 判断子序列

人生苦短,我用 Python!

退出移动版