关于程序员:综合笔试题30-串联所有单词的子串

7次阅读

共计 2922 个字符,预计需要花费 8 分钟才能阅读完成。

题目形容

这是 LeetCode 上的 30. 串联所有单词的子串 ,难度为 艰难

Tag :「哈希表」、「滑动窗口」、「枚举」

给定一个字符串 s 和一些长度雷同的单词 words

找出 s 中恰好能够由 words 中所有单词串联造成的子串的起始地位。

留神子串要与 words 中的单词齐全匹配,两头不能有其余字符,但不须要思考 words 中单词串联的程序。

示例 1:

输出:s = "barfoothefoobarman",
words = ["foo","bar"]
  
输入:[0,9]

解释:从索引 0 和 9 开始的子串别离是 "barfoo" 和 "foobar"。输入的程序不重要, [9,0] 也是无效答案。

示例 2:

输出:s = "wordgoodgoodgoodbestword",
words = ["word","good","best","word"]
  
输入:[]

提醒:

  • $1 <= s.length <= 10^4$
  • s 由小写英文字母组成
  • $1 <= words.length <= 5000$
  • $1 <= words[i].length <= 30$
  • words[i] 由小写英文字母组成

奢侈哈希表

n 为字符串 s 的长度,m 为数组 words 的长度(单词的个数),w 为单个单词的长度。

因为 words 外面每个单词长度固定,而咱们要找的字符串只能恰好蕴含所有的单词,因而咱们要找的指标子串的长度为 $m \times w$。

那么一个直观的思路是:

  1. 应用哈希表 map 记录 words 中每个单词的呈现次数
  2. 枚举 s 中的每个字符作为终点,往后获得长度为 $m \times w$ 的子串 sub
  3. 应用哈希表 cur 统计 sub 每个单词的呈现次数(每隔 w 长度作为一个单词)
  4. 比拟 curmap 是否雷同

留神:在步骤 $3$ 中,如果发现 sub 中蕴含了 words 没有呈现的单词,能够间接剪枝。

剪枝处应用了带标签的 continue 语句间接回到外层循环进行。

代码:

class Solution {public List<Integer> findSubstring(String s, String[] words) {int n = s.length(), m = words.length, w = words[0].length();
        Map<String, Integer> map = new HashMap<>();
        for (String word : words) map.put(word, map.getOrDefault(word, 0) + 1);
        List<Integer> ans = new ArrayList<>();
        out:for (int i = 0; i + m * w <= n; i++) {Map<String, Integer> cur = new HashMap<>();
            String sub = s.substring(i, i + m * w);
            for (int j = 0; j < sub.length(); j += w) {String item = sub.substring(j, j + w);
                if (!map.containsKey(item)) continue out;
                cur.put(item, cur.getOrDefault(item, 0) + 1);
            }
            if (cur.equals(map)) ans.add(i);
        }
        return ans;
    }
}
  • 工夫复杂度:将 words 中的单词存入哈希表,复杂度为 $O(m)$(因为字符串长度固定且不超过 $30$,假设所有哈希操作均为 $O(1)$ 的);而后第一层循环枚举 s 中的每个字符作为终点,复杂度为 $O(n)$;在循环中将 sub 划分为 m 个单词进行统计,枚举了 m - 1 个下标,复杂度为 $O(m)$;每个字符串的长度为 w。整体复杂度为 $O(n \times m \times w)$
  • 空间复杂度:$O(m \times w)$

滑动窗口 + 哈希表

事实上,咱们能够 优化这个枚举终点的过程

咱们能够将终点依据 以后下标与单词长度的取余后果 进行分类,这样咱们就不必频繁的建设新的哈希表和进行单词统计。

代码:

class Solution {public List<Integer> findSubstring(String s, String[] words) {int n = s.length(), m = words.length, w = words[0].length();
        // 统计 words 中「每个指标单词」的呈现次数
        Map<String, Integer> map = new HashMap<>();
        for (String word : words) map.put(word, map.getOrDefault(word, 0) + 1);
        List<Integer> ans = new ArrayList<>();
        for (int i = 0; i < w; i++) {
            // 构建一个以后子串对应 map,统计以后子串中「每个指标单词」的呈现次数
            Map<String, Integer> curMap = new HashMap<>();
            // 滑动窗口的大小固定是 m * w,每次将下一个单词增加进 curMap,上一个单词移出 curMap
            for (int j = i; j + w <= n; j += w) {String cur = s.substring(j, j + w);
                curMap.put(cur, curMap.getOrDefault(cur, 0) + 1);
                if (j >= i + (m * w)) {
                    int idx = j - m * w;
                    String prev = s.substring(idx, idx + w);
                    if (curMap.get(prev) == 1) curMap.remove(prev);
                    else curMap.put(prev, curMap.get(prev) - 1);
                    if (!curMap.getOrDefault(prev, 0).equals(map.getOrDefault(prev, 0))) continue;
                }
                if (!curMap.getOrDefault(cur, 0).equals(map.getOrDefault(cur, 0))) continue;
                // 下面两个 continue 能够缩小 map 之间的 equals 操作
                if (curMap.equals(map)) ans.add(j - (m - 1) * w);
            }
        }
        return ans;
    }
}
  • 工夫复杂度:将 words 中的单词存入哈希表,复杂度为 $O(m)$(因为字符串长度固定且不超过 $30$,假设所有哈希操作均为 $O(1)$ 的);而后枚举了取余的后果,复杂度为 $O(w)$;每次循环最多解决 n 长度的字符串,复杂度为 $O(n)$。整体复杂度为 $O(m + w \times n)$
  • 空间复杂度:$O(m \times w)$

最初

这是咱们「刷穿 LeetCode」系列文章的第 No.30 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,局部是有锁题,咱们将先把所有不带锁的题目刷完。

在这个系列文章外面,除了解说解题思路以外,还会尽可能给出最为简洁的代码。如果波及通解还会相应的代码模板。

为了不便各位同学可能电脑上进行调试和提交代码,我建设了相干的仓库:https://github.com/SharingSou…。

在仓库地址里,你能够看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其余优选题解。

本文由 mdnice 多平台公布

正文完
 0