1. 程式人生 > 其它 >力扣刷題Day2 --- 3.無重複字元的最長子串

力扣刷題Day2 --- 3.無重複字元的最長子串

2021.5.4

題目:

給定一個字串,請你找出其中不含有重複字元的最長子串的長度。

難度:中等

示例:

輸入: s = "pwwkew"
輸出: 3
解釋: 因為無重複字元的最長子串是"wke",所以其長度為 3。
  請注意,你的答案必須是 子串 的長度,"pwke"是一個子序列,不是子串。

力扣題目地址:

https://leetcode-cn.com/problems/longest-substring-without-repeating-characters/

解題思路:

本文思路摘自力扣大佬思路

第一步:解法一

我們最開始肯定是先想到用一個函式去判斷子串是否有重複,然後再用一個函式迴圈窮舉所有子串,找出最長子串。思路是沒問題的,但是三個for迴圈在資料大的時候會超時。

圖解:i其實相當於左指標,j相當於右指標。

public int lengthOfLongestSubstring(String s) {
    int n = s.length();
    int ans = 0;//儲存當前得到滿足條件的子串的最大值
    for (int i = 0; i < n; i++)
        for (int j = i + 1; j < n+1; j++) //之所以 j< n+1,是因為我們子串是 [i,j),左閉右開.就像上面圖片一樣,子串最長為3,所以j需要比它多1才能表示出來
            if (allUnique(s, i, j)) ans = Math.max(ans, j - i); //更新 ans
    return ans;
}

public boolean allUnique(String s, int start, int end) {
    Set<Character> set = new HashSet<>();//初始化 hash set
    for (int i = start; i < end; i++) {//遍歷每個字元
        Character ch = s.charAt(i);
        if (set.contains(ch)) return false; //判斷字元在不在 set 中
        set.add(ch);//不在的話將該字元新增到 set 裡邊
    }
    return true;
}

第二步:解法二

遺憾的是上邊的演算法沒有通過 leetCode,時間複雜度太大,造成了超時。我們怎麼來優化一下呢?

上邊的演算法中,我們假設當 i 取 0 的時候,

  • j 取 1,判斷字串 str[0,1) 中有沒有重複的字元。
  • j 取 2,判斷字串 str[0,2) 中有沒有重複的字元。
  • j 取 3,判斷字串 str[0,3) 中有沒有重複的字元。
  • j 取 4,判斷字串 str[0,4) 中有沒有重複的字元。

做了很多重複的工作,因為如果 str[0,1) 中沒有重複的字元,我們不需要再判斷整個字串 str[0,2) 中有沒有重複的字元,而只需要判斷 str[2] 在不在 str[0,1) 中,不在的話,就表明 str[0,2) 中沒有重複的字元

。如果在的話,那麼 str[0,3) ,str[0,4) ,str[0,5) 一定有重複的字元,所以此時後邊的 j 也不需要繼續增加了。i ++ 進入下次的迴圈就可以了。

此外,我們的 j 也不需要取 j + 1,而只需要從當前的 j 開始就可以了。

綜上,其實整個關於 j 的迴圈我們完全可以去掉了,此時可以理解變成了一個「滑動視窗」。

整體就是橘色視窗在依次向右移動。

判斷一個字元在不在字串中,我們需要可以遍歷整個字串,遍歷需要的時間複雜度就是 O(n),加上最外層的 i 的迴圈,總體複雜度就是 O(n²)。我們可以繼續優化,判斷字元在不在一個字串,我們可以將已有的字串存到 Hash 裡,這樣的時間複雜度是 O(1),總的時間複雜度就變成了 O(n)。

public class Solution {
    public int lengthOfLongestSubstring(String s) {
        int n = s.length();
        Set<Character> set = new HashSet<>();
        int ans = 0, i = 0, j = 0;
        while (i < n && j < n) {
            if (!set.contains(s.charAt(j))){
                set.add(s.charAt(j++));
                ans = Math.max(ans, j - i);
            }
            else {
                set.remove(s.charAt(i++));
            }
        }
        return ans;
    }
}

時間複雜度:在最壞的情況下,while 迴圈中的語句會執行 2n 次,例如 abcdefgg,開始的時候 j 一直後移直到到達第二個 g 的時候固定不變 ,然後 i 開始一直後移直到 n ,所以總共執行了 2n 次,時間複雜度為 O(n)。

空間複雜度:和上邊的類似,需要一個 Hash 儲存子串,所以是 O(min(m,n))。到這裡,我們的解法就已經算湊合了,但是還有可以進行優化的地方,且看解法三

第三步:解法三

繼續優化,我們看上邊的演算法的一種情況。

當 j 指向的 c 存在於前邊的子串 abcd 中,此時 i 向前移到 b ,此時子串中仍然含有 c,還得繼續移動,所以這裡其實可以優化。我們可以一步到位,直接移動到子串 c 的位置的下一位!這種想法和在串的模式匹配裡面用到的思想是很相似的。

實現這樣的話,我們將 set 改為 map ,將字元存為 key ,將對應的下標存到 value 裡就實現了。這裡的i代表左指標,j代表右指標

class Solution {
    public int lengthOfLongestSubstring(String s) {
        int n=s.length();
        int ans=0;
        Map<Character,Integer> map=new HashMap<>();
        for(int i=0,j=0;j<n;j++){
            if(map.containsKey(s.charAt(j))){
                i=Math.max(map.get(s.charAt(j))+1,i); //當前字元包含在當前有效的子段中,那麼我們就需要更新左指標。(比如像上面圖片一樣,j指標指向c的時候(abcdc),當前字元在有效欄位中,那麼我們需要把i指標移動到第一個c的右邊,也就是d的位置,所以是s.charAt(j))+1)
            }
            ans=Math.max(ans,j-i+1);
            map.put(s.charAt(j),j);
        }
        return ans;
    }
}

與解法二相比

由於採取了 i 跳躍的形式,所以 map 之前存的字元沒有進行 remove ,所以 if 語句中進行了Math.max ( map.get ( s.charAt ( j ) ) , i ),要確認得到的下標不是 i 前邊的。所以取得範圍在[i,j]之間。

還有個不同之處是 j 每次迴圈都進行了自加 1 ,因為 i 的跳躍已經保證了 str[ i , j] 內沒有重複的字串,所以 j 直接可以加 1 。而解法二中,要保持 j 的位置不變,因為不知道和 j 重複的字元在哪個位置。

最後個不同之處是, ans 在每次迴圈中都進行更新,因為 ans 更新前 i 都進行了更新,已經保證了當前的子串符合條件,所以可以更新 ans 。而解法二中,只有噹噹前的子串不包含當前的字元時,才進行更新。

時間複雜度:我們將 2n 優化到了 n ,但最終還是和之前一樣,O(n)。

空間複雜度:也是一樣的,O(min(m,n))。