leetcode2重复的DNA序列

所有 DNA 都由一系列缩写为 A，C，G 和 T 的核苷酸组成，例如：“ACGAATTCCG”。在研究 DNA 时，识别 DNA 中的重复序列有时会对研究非常有帮助。

编写一个函数来查找 DNA 分子中所有出现超过一次的 10 个字母长的序列（子串）。

示例：

输入：s = “AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT”
输出：[“AAAAACCCCC”, “CCCCCAAAAA”]

来源：力扣（LeetCode）
链接：https://leetcode-cn.com/probl…
著作权归领扣网络所有。商业转载请联系官方授权，非商业转载请注明出处。

我这里用的是list，其实用set性能更好，list进行查询是O(logn)，而set是O(1)的。

public List<String> findRepeatedDnaSequences(String s) {
        int len = s.length();
        List<String> res = new ArrayList<String>();
        if (len <= 10) return res;
        Map<String, Integer> all = new HashMap<String, Integer>();
        for (int i = 0; i <= len - 10; i++) {
            String str = s.substring(i, i+10);
            if (all.containsKey(str)) {
                all.put(str, all.get(str) + 1);
            } else {
                all.put(str,1);
            }
        }
        for (Map.Entry<String, Integer> stringIntegerEntry : all.entrySet()) {
            if (stringIntegerEntry.getValue() > 1) {
                res.add(stringIntegerEntry.getKey());
            }
        }
        return res;
    }

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存