关于python:LeetCode解题报告-522-最长特殊序列-II

@TOC

一、题目

1. 题目形容

最长非凡序列 II

难度：中等

给定字符串列表 strs ，返回其中 最长的非凡序列 。如果最长非凡序列不存在，返回 -1 。

非凡序列 定义如下：该序列为某字符串 独有的子序列（即不能是其余字符串的子序列）。

s 的 子序列能够通过删去字符串 s 中的某些字符实现。

例如，"abc" 是 "aebdc" 的子序列，因为您能够删除"aebdc"中的下划线字符来失去 "abc" 。"aebdc"的子序列还包含"aebdc"、 "aeb" 和 ”” (空字符串)。

示例 1：

输出: strs = ["aba","cdc","eae"]
输入: 3

示例 2:

输出: strs = ["aaa","aaa","aa"]
输入: -1

提醒:

2 <= strs.length <= 50
1 <= strs[i].length <= 10
strs[i] 只蕴含小写英文字母

2. 原题链接

链接: 522. 最长非凡序列 II

二、解题报告

1. 思路剖析

这题难就难在下边这个显然上，剩下的都是套路。

先说一个显然：
如果s的子序列ss是一个非凡序列，那么s更是非凡序列。

因而本题只须要判断每个字符串是否是其它字符串的子序列。
如果一个字符串不是任何一个其它字符串的子序列，这个字符串自身就是一个非凡序列，能够用来更新答案。
最初取所有非凡字符串的长度求max即可，没有就置-1.

子序列自动机

因为枚举每两个点对，因而对每个字符串，都要查看n-1个别的串是否是它的子序列(不剪枝的状况)。
对一个串屡次查看子序列的办法，能够用到子序列自动机。
判断子序列的奢侈办法是用双指针i,j。i在原串上，j在模式串上。咱们发现i向右挪动时，肯定优先取最近的(即最早呈现)、等于p[j]的字符，复每次最坏匹配复杂度 O(n+m)。
那么咱们能够用dp的形式预处理进去每个字符下一个字符最早呈现的地位，匹配时就能够间接i指针挪动到下一个合乎的字符，跳过大量无用比拟。
自动机结构复杂度 O(mc)*,c=26即为字典长度,m是原串长度。每次匹配复杂度为 O(n)。
参考我的题解Python子序列自动机做法

2. 复杂度剖析
显然枚举点对n^2是跑不了的。
设字符串均匀长度为m。
双指针做法复杂度 T(n) = O(n×n×2m)
自动机做法，每个字符串只须要结构一次自动机，消耗m×26,而后剩下n-1个串去匹配消耗m，因而复杂度T(n) = O(n×(m×26+n×m)) = O(n×n×m+n×m×26)
次要复杂度仍然取决于外层n^2。
省的工夫不多 diff = n×n×m – n×m×26

3. 代码实现

子序列自动机。

class SubSequenceAuto:
    def __init__(self,s,abc='abcdefghijklmnopqrstuvwxyz'):
        self.s,self.abc = s,abc
        self.n,abc_len = len(s),len(abc)
        self.abc_index = {v:k for k,v in enumerate(abc)}
        self.dp = [[self.n]*abc_len for _ in range(self.n+1)]
        dp = self.dp
        # dp.append([self.n]*abc_len)
        for i in range(self.n-1,-1,-1):
            dp[i] = dp[i+1][:]
            dp[i][self.abc_index[s[i]]] = i
            # for j in range(abc_len):
            #     dp[i][j] = i if s[i]==abc[j] else dp[i+1][j] 
    def query_is_sub_seq(self,t):
        dp = self.dp
        abc_index = self.abc_index
        n = self.n
        r = 0
        for c in t:
            r = dp[r][abc_index[c]]
            if r == n:
                return False
            r += 1
        return True
class Solution:
    def findLUSlength(self, strs: List[str]) -> int:
        """
        先说一个显然：如果s的子序列ss是一个非凡序列，那么s更是非凡序列。
        因而本题只须要判断每个字符串是否是其它字符串的子序列。
        判断子序列能够双指针，或者用子序列自动机。
        """
        n = len(strs)
        flags = [True] * n  # 每个字符串是否是非凡序列，初始化为0。如果他是他人的子序列，则置False
        # 以下判断j是不是i的子序列
        for i in range(n):
            sba = SubSequenceAuto(strs[i])
            for j in range(n):
                if i == j or flags[j] ==False:
                    continue
                if sba.query_is_sub_seq(strs[j]):
                    flags[j] = False 
        
        ans = -1
        for i in range(n):
            if flags[i]:
                ans = max(ans,len(strs[i]))
        return ans

三、本题小结

1) 子序列自动机的做法能够优化判断子序列的工夫，当字符串长度十分大时，劣势才显著。但这题数据较弱，因而劣势不显著。

2) 有工夫把子序列自动机模板写一下。

四、参考链接

前置题: 392. 判断子序列

人生苦短，我用Python！

关于python:LeetCode解题报告-522-最长特殊序列-II

一、题目

1. 题目形容

2. 原题链接

二、解题报告

1. 思路剖析

子序列自动机

2. 复杂度剖析

3. 代码实现

三、本题小结

四、参考链接

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于python:LeetCode解题报告-522-最长特殊序列-II

一、 题目

1. 题目形容

2. 原题链接

二、 解题报告

1. 思路剖析

子序列自动机

2. 复杂度剖析

3. 代码实现

三、 本题小结

四、 参考链接

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

一、题目

二、解题报告

三、本题小结

四、参考链接

发表回复取消回复