1. 程式人生 > >演算法題之字串匹配問題

演算法題之字串匹配問題

我最近複習一道困難程度的演算法題,發現了許多有趣之處。在借鑑了他人解法後,發現從最簡單的情況反推到原題是一種解鎖新進階的感覺。從遞迴到動態規劃,思維上一步一步遞進,如同一部跌宕起伏的小說,記錄下來和諸君共賞之。

題目如下:

給你一個字串 s 和一個字元規律 p,請你來實現一個支援 '.' 和 '*' 的正則表示式匹配。

'.' 匹配任意單個字元
'*' 匹配零個或多個前面的那一個元素
所謂匹配,是要涵蓋 整個 字串 s的,而不是部分字串。

說明:

s 可能為空,且只包含從 a-z 的小寫字母。
p 可能為空,且只包含從 a-z 的小寫字母,以及字元 . 和 *。
示例 1:

輸入:
s = "aa"
p = "a"
輸出: false
解釋: "a" 無法匹配 "aa" 整個字串。
示例 2:

輸入:
s = "aa"
p = "a*"
輸出: true
解釋: 因為 '*' 代表可以匹配零個或多個前面的那一個元素, 在這裡前面的元素就是 'a'。因此,字串 "aa" 可被視為 'a' 重複了一次。
示例 3:

輸入:
s = "ab"
p = ".*"
輸出: true
解釋: ".*" 表示可匹配零個或多個('*')任意字元('.')。
示例 4:

輸入:
s = "aab"
p = "c*a*b"
輸出: true
解釋: 因為 '*' 表示零個或多個,這裡 'c' 為 0 個, 'a' 被重複一次。因此可以匹配字串 "aab"。
示例 5:

輸入:
s = "mississippi"
p = "mis*is*p*."
輸出: false

來源:力扣(LeetCode)

這是一道關於字串匹配的問題,其中匹配字串裡面可能含有兩種特殊符號「.」和「*」。

說時候剛拿到這道題的時候我很懵逼,直接動手分析到帶有「*」符號的時候,感覺不同情況挺難分析下去的,甚至陷入了思維的僵局。

如果能讓問題簡化一下該多好呀,沒錯,如果我們把問題變成我們以前做過的問題或者容易做的問題,是否能從中發現新的思路?

假設問題變成:求兩個純字串進行匹配。實現程式碼可以如下:

package main

func isMatch(text string, pattern string) bool {
    if pattern == "" {
        if text != "" {
            return false
        } else {
            return true
        }
    }
    first_match := false

    if pattern[0] == text[0] {
        first_match = true
    }

    return first_match && isMatch(text[1:], pattern[1:])
}

func main() {
    text := "abc"
    pattern := "ab"
    isMatch(text, pattern)
}

這裡用到了遞迴,之所以這麼處理,是為了後續迭代。
那麼如果再增加一個條件,把「.」符號加上,如果是帶有「.」符號的字串去匹配一段字串呢?

需要在實現的時候考慮第一個位元組是否是該特殊符號

func isMatch2(text string, pattern string) bool {
    if pattern == "" {
        if text != "" {
            return false
        } else {
            return true
        }
    }
    first_match := false

    if pattern[0] == text[0] || pattern[0] == '.' {
        first_match = true
    }
    return first_match && isMatch2(text[1:], pattern[1:])
}

能解決「.」符號的情況,針對「*」符號的情況,我們可以進一步思考。
可能性:

  • 1.匹配0次。
  • 2.匹配1次。
    具體程式碼如下:
func isMatch(text string, pattern string) bool {
    if pattern == "" {
        if text != "" {
            return false
        } else {
            return true
        }
    }
    first_match := false
    
    text_bool := false
    if text != "" {
        text_bool = true
    }
    
    if text_bool && (pattern[0] == text[0] || pattern[0] == '.') {
        first_match = true
    }
    
    if len(pattern) >=2 && pattern[1] == '*' {
        return isMatch(text, pattern[2:]) || first_match && isMatch(text[1:], pattern)
    } else {
        return first_match && isMatch(text[1:], pattern[1:])
    }
}

這段程式碼都是用遞迴實現的,但是遞迴的時間複雜度消耗更大,完全可以考慮將每一次遞迴的結果儲存下來,於是我們又可以往動態規劃的方向思考。
選擇dp儲存結果,dp[i][j]表示前i個字串被j個位元組pattern匹配的結果。

func isMatch(s string, p string) bool {
    memory := make(map[string]bool)
    return dp(0, 0, memory, s, p)

}

func dp(i int, j int, memory map[string]bool, s string, p string) bool {
    iToStr := strconv.Itoa(i)
    jToStr := strconv.Itoa(j)
    keyStr := iToStr + "," + jToStr
    if _, ok := memory[keyStr]; ok {
        return memory[keyStr]
    }
    if j == len(p) {
        return i == len(s)
    }

    first := (i < len(s)) && (p[j] == s[i] || p[j] == '.')
    var ans bool
    if j <= (len(p) -2) && p[j+1] == '*' {
        ans = dp(i, j+2, memory,s, p) || first && dp(i+1, j, memory, s, p)
    } else {
        ans = first && dp(i+1, j+1, memory, s, p)
    }
    memory[keyStr] = ans
    return ans
}

反思:還有無更好的解法呢?比如把迴圈放到外層,而不是封裝成dp函式