每天一道LeetCode-----尋找給定字串中重複出現的子串

阿新 • • 發佈：2019-01-02

Repeated DNA Sequences

在給定字串中尋找重複出現的序列，每個序列長度為10

可以採用unordered_map記錄每個序列出現的個數，將出現超過一次的新增到結果集中

程式碼如下

class Solution {
public:
    vector<string> findRepeatedDnaSequences(string s) {
        if(s.size() < 10)   return {};

        vector<string> res;
        unordered_map<string 
, int> hash;
        size_t first = 0;
        size_t last = 10;
        while(last <= s.size())
        {
            auto str = s.substr(first, last - first);
            if(hash[str] == 1)
                res.emplace_back(str);
            ++hash[str];
            ++first;
            ++last;
        }
        return 
 res;
    }
};

但是這種方法每次都需要呼叫substr獲取子串，容易造成效能瓶頸，有什麼方法不用呼叫substr也能判斷當前的這個子串出現過呢

由於規定了子串長度為10，而且子串中只能出現”AGCT“四個字元中的一個，那麼可以考慮用20個bit來表示長度為10的子串，其中每個字元佔兩bit。隨後採用滑動視窗的思想，新到的字元新增到20bit的低位，溢位的字元丟掉

程式碼如下

class Solution {
public:
    vector<string> findRepeatedDnaSequences(string s) {
        if(s.size() < 10 
)   return {};

        vector<string> res;
        unordered_map<int, int> hash;
        int val = 0;
        /* 掩碼，用於將左溢位的兩位清零 */
        int mask = (1 << 20) - 1;
        /* 每個字元佔兩位，toBit要保證能區分開四個字元 */
        for(int i = 0; i < 10; ++i)
            val = (val << 2) | toBit(s[i]);
        hash[val] = 1;
        for(int i = 10; i < s.size(); ++i)
        {
            val = ((val << 2) | toBit(s[i])) & mask;
            if(hash[val] == 1)
                res.emplace_back(s.substr(i - 10 + 1, 10));
            ++hash[val];
        }
        return res;
    }
private:
    int toBit(char ch)
    {
        switch(ch)
        {
            case 'A':
                return 0;
            case 'G':
                return 1;
            case 'C':
                return 2;
            case 'T':
                return 3;
        }
    }
};

每天一道LeetCode-----尋找給定字串中重複出現的子串

Repeated DNA Sequences 在給定字串中尋找重複出現的序列，每個序列長度為10 可以採用unordered_map記錄每個序列出現的個數，將出現超過一次的新增到結果集中程式碼如下 class Solution { publ

每天一道LeetCode-----找到給定陣列中第三大的值

要求找到給定陣列中第三大的數。其中第一大的數，第二大的數，第三大的數互不相同，即嚴格的小於關係。並且規定時間複雜度是O(n)。另外如果找不到第三大的數，則返回陣列中第一大的數可以用三個變數first, second, third分別記錄第一大第二大以

每天一道LeetCode-----判斷給定字串是否符合某個模式

Isomorphic Strings 給定兩個字串，判斷其中一個是否能轉換成另一個，轉換規則如下必須是一對一同一個字元兩次轉換必須相同，如果第一次字元’a’轉換成’b’，那麼當下次遇到

查詢字串中重複的子串，並輸出重複的次數

思路如下：對一個字串，從第一個字元開始，檢查前兩個字元組成的字串，是否被它後面的子串包含。如果沒有包含，則從第二個字元開始同樣的方法檢查；如果包含則統計包含數量。方法是：被檢查的子串根據重複串下標削去

C/C++中strstr()函式：返回字串中首次出現子串的地址

Opencv學堂 http://mp.weixin.qq.com/s?__biz=MzA4MDExMDEyMw==&mid=100000109&idx=1&sn=7540b49e869c3e27f87c84f6f3dfe9a8&chksm

每天一道LeetCode-----尋找二叉搜尋樹中第k小的元素

Kth Smallest Element in a BST 給頂一個二叉搜尋樹的根節點，找到這棵數第k小的值兩種方法遞迴法的中序遍歷迭代法的中序遍歷遞迴法，常規的中序遍歷

c語言查詢兩個字串中的公共子串

程式碼如下：#include <stdio.h> #include <string.h> #include <stdlib.h> void getCommon(ch

spoj 694 求一個字串中不相同子串的個數

Given a string, we need to find the total number of its distinct substrings. Input T- number of test cases. T<=20; Each test c

刪除字串中特定的子串

//********************************************************************************* //【功能】在給定字串中查詢所有

每天一道LeetCode-----在字串s中找到最短的包含字串t中所有字元的子串，子串中字元順序無要求且可以有其他字元

Minimum Window Substring 要求在源字串s中找到長度最短的子串，這個子串包含目標字串t中的所有字元，字元順序沒有要求。注意在找到的子串中可以包含t中沒有的字元。乍一看是滑動窗的問題，如果題目要求是”在s中找到子串t，t中字

每天一道LeetCode-----計算字串s中有多少個子序列和字串t相等

Distinct Subsequences 判斷字串s中有多少個子序列和t相等，一個字串的子序列是將字串中若干字元刪除後形成的字串因為子序列中字元的順序是固定的，所以不能採用滑動窗(滑動窗常用於解決只要求個數不要求順序的問題)。另外，對於源字串

[leetcode]151. Reverse Words in a String翻轉給定字串中的單詞

Given an input string, reverse the string word by word. Example: Input: "the sky is blue",Output: "blue is sky the".Note: A word is defined as a sequen

每天一道LeetCode-----找到二叉樹所有和為給定值的路徑

Path Sum 判斷二叉樹中有沒有一條從根節點到葉子節點的路徑元素和為給定值只需要遍歷所有路徑即可，需要注意的是對葉子節點的判斷，需要滿足左右兩個節點都是空的條件時才為葉子節點程式碼如下 /** * Definition for a

每天一道LeetCode-----將字串的連續相同的字符合併成一個字元後加個數

Count and Say 原題連結 Count and Say 求出第n個表示式，第n個表示式由第n-1個表示式的讀音構成。如第3個表示式為21，讀作1個2,1個1，所以第4個表示式就是1211。第4個表示式讀作1個1,1個2,2個1，所以第5

leetcode之壓縮字串中的重複字元

題目通過鍵盤輸入一串小寫字母(a~z)組成的字串。請編寫一個字串壓縮程式，將字串中連續出現的重複字母進行壓縮，並輸出壓縮後的字串。壓縮規則： 1、僅壓縮連續重複出現的字元。比如字串”abcbc”由於無連續重複字元，壓縮後的字串還是”abcbc”。 2、壓縮欄位的格式為

找出給定字串中第一個不重複的字元

給定一串字串，找出其中第一個不重複的字元。如：輸入”abcddcaeb1~soop”，輸出’e’ 方法一思路：定義list<char> store和list<char> storeDel，對輸入字串str進行遍歷，對st

每天一道LeetCode-----找出給定序列的所有子序列

Subsets 給定一個數組序列，找出所有子序列深度優先掃一遍:) class Solution { public: vector<vector<int>> subsets(vector<int>&

尋找一個字串中的最長重複子串（字尾陣列）&找出一個字串中最長不重複子串

一、尋找一個字串中的最長重複子串（字尾陣列）字尾陣列其實可以看尋找一個字串中的最長重複子串（字尾陣列）作一個由字串s倒數i個字元組成的子串的集合，其中0<i<s.length()，例如字串strstr的字尾陣列為： {r,tr,str,rstr,trstr,

每天一道LeetCode-----判斷陣列中是否存在兩個位置上面的值相等並且下標的差小於某個值

判斷給定陣列中是否存在i和j，使得nums[i] == nums[j]並且j - i <= k 只需要儲存每個數最後出現的下標，當再次遇到這個數時，進行比較，如果滿足條件則返回，否則更新

Java面試題演算法篇尋找字串中最長的重複元素子串

package com.puhui.goosecard.web.utils; // Java program to find the maximum consecutive // repeating character in given string class GFG

每天一道LeetCode-----尋找給定字串中重複出現的子串

Repeated DNA Sequences

相關推薦