kmp演算法/子串匹配

阿新 • • 發佈：2020-12-12

17.kmp演算法/子串匹配

a.整體框架

講解

講解連結

首先宣告所有陣列第一個下標從0開始。(有些教程會選擇從1開始，先說清楚，以免搞混了)。

這裡我們使用一個例子來簡單說明一下

例如

如果我們用暴力尋找的話，那麼過程是

總共比對了 4 + 1 + 1 + 1 + 7 + 1 +1 + 1 + 3 + 1 + 1 + 8 +1 +1 +1 +8 = 41 (次)

如果改進成KMP的話，那麼運算過程就是(灰色地方是KMP演算法不去考慮的地方，紅點是每次比較的字串位置)

總共比對了 4 + 1 + 7 + 1 + 1 +8 + 4 = 26 (次)

如果我們看紅點在abcxabcdabxabcdabcdabcy的位置，我們就會發現紅點一直在向前移動，不會往後退/回頭。這就是KMP演算法的優點即不會倒退(也有人稱作回溯)，所以就能避免不必要的匹配檢查。

讓我們依次看看KMP演算法在上面的例子中都做了些什麼。

首先讓我們看一下第一個例子。

綠框中是KMP演算法跳過的地方，那麼我們就來對比一下兩個紅框裡面的內容。

這裡我們可以看到，深綠色方框那裡是不相同字元的位置與新一輪判定的開始位置。

深橘黃色方框裡的是已經匹配成功的字串 abc。

關鍵的地方來了，因為已經匹配成功的字串abc中沒有相同的前後綴，所以下一次比對要從abcdabcy的首位開始比較。

我們簡單地來看一下abc的前後綴情況（ac寫錯了，是bc）

要注意，這裡我們看的前後綴的長度要小於已匹配到的字串長度，因為如果長度一樣了那就不用分前後綴了，也沒有比較的意義了。

因為沒有相同的前後綴，我們就不用擔心錯過什麼，直接從配對失敗的地方開始新的匹配就行了。

這個很好理解，讓我們假設一下如果在上面這個例子中間有這麼一種情況

在這裡如果符匹配條件我們至少需要滿足方框內的字元相同。

讓我們看看方塊內的字元處於abc中的什麼位置

在黃色框內，bc屬於abc的字尾，ab屬於abc的字首，所以如果條件符合的話，abc需要有相同的前後綴。

不理解為什麼的同學不用擔心，現在只要記住我們在尋找相同前後綴就行了，一會看完應該就能想通了。

讓我們看看下一個例子。

在這個例子中KMP演算法跳過了綠色方框的部分，直接運行了紅色方框裡的內容。讓我們看看紅色方框裡發生了什麼。

深綠色方框位置是不相同字元位置與新一輪比較的位置。

深橘黃色方框裡的是已經匹配的字串 abcdab。

讓我們來找一下 abcdab的前後綴吧。

我們發現abcdab有相同的前後綴。

重點又來了，如果有相同的前後綴，我們就需要把字首移動到字尾的位置上。

這樣abcdabcy就向右移動了四位，然後開始比較abcdabcy[相同前後綴長度] 上的字元，即第3個字元c(預設索引從0開始)。

不明白沒有關係，我們再看兩個例子。

在上面這個例子中，綠色依然是被忽略的部分，紅色方框是KMP演算法執行的部分。

讓我們繼續關注紅色方框裡的內容

深綠色的地方是匹配到不一樣字元的位置，也是下一次比較的開始位置。

深橘色的地方是已經成功匹配的字串ab。

由於ab沒有相同的前後綴，所以下一次比較從abcdabcy[0] 開始。

最後我們看看這個例子

依舊只看紅色方框部分

深綠色的地方是匹配到不一樣字元的位置，也是下一次比較的開始位置。

深橘色的地方是已經成功匹配的字串abcdabc。

讓我們來看看abcdabc的前後綴吧。

我們發現abcdabc有相同的前後綴abc，我們就需要把字首移動到字尾的位置上。

這樣abcdabcy就向右移動了四位，然後開始比較abcdabcy[相同前後綴長度] 上的字元，即第3個字元d(預設索引從0開始)。

最後我們比對發現找到了目標字串。

通過上面的例子，我們發現每當我們匹配失敗，就需要尋找匹配成功的字串中有沒有相同的前後綴（最長的前後綴），然後再判定下一次比較要從哪一位開始。

邏輯實現：
還是回到上面的例子，如果每次匹配失敗都去判定一次是否有相同前後綴的話，那麼就太麻煩了，所以我們可以在匹配前就把各種情況的前後綴找出來。

上面是我們能列舉出來的所有情況，KMP演算法需要的關鍵資訊就是最左邊的匹配數與最右邊的前/字尾長度。

因為8匹配就匹配完成，所以我們其實只需要考慮0～7匹配的情況，總共8種情況。

我們可以用一組陣列來儲存此資料，我們命名此陣列為next陣列。

int[] next = new int[] { 0,0,0,0,0,1,2,3};

所以每當我們匹配失敗的時候，我們就可以通過next陣列來快速定位下一個需要對比的索引位置。

這樣我們的KMP演算法可以理解為

KMP(string target, string txt){
1）計算next陣列
2）通過迴圈來對比target與txt字串
}

結論與演算法

總之，在不匹配的時候主串不會前移，要麼模式串前移到前後綴長度的位置，要麼主串後移一位。

public void kmp(String haystack, String needle){
        int[] next = getNext(needle);
        int hi = 0;  // 主串的索引
        int ni = 0;  // 模式串的索引
        while (hi < haystack.length()){
            if (haystack.charAt(hi) == needle.charAt(ni)){
                hi++;
                ni++;  // 相等，各進一步
            }else if(ni > 0){
                ni = next[ni - 1];  // 失配，若模式串索引大於0，則根據next陣列移動模式串
            }else {
                hi++;  // 失配，若模式串索引等於0，則將主串後移一位
            }
            if (ni == needle.length()) {
                System.out.println(hi - ni);
                ni = next[ni - 1];  // 多個匹配位置
            }
        }
    }

kmp演算法/子串匹配

17.kmp演算法/子串匹配 a.整體框架講解講解連結首先宣告所有陣列第一個下標從0開始。(有些教程會選擇從1開始，先說清楚，以免搞混了)。

KMP子串匹配

using namespace std; #include <iostream> #include<string> //自定義字串儲存結構String（包括char陣列、length長度）

kmp演算法（字串匹配）

參考視訊：https://www.bilibili.com/video/BV1jb411V78H?from=search&seid=4313084886343126293 參考部落格：https://blog.csdn.net/qq_34181098/article/details/107066929

string子串匹配（用string自帶函式，不涉及char陣列轉換）

using namespace std; #include <iostream> #include<string> //第1種，用string自帶的s.subdtr()擷取任意子串，再用s.compare()確定是否與待求子串相等，時間複雜度O（len1*len2）

滾動雜湊解決子串匹配問題

滾動雜湊我們判斷兩個字串是否相同，往往是通過比較兩個字串的雜湊。常用語言中計算字串雜湊的方法往往是一個字元一個字元的計算，導致計算字串雜湊的時間複雜度是O（C），其中C是字串的長度。

242. 子串匹配

思路：只要列舉最終匹配的子串是從s中的哪個字元開始的就好了，並記錄最小值。

C++ 子串匹配主串

暴力匹配 #include <iostream> #include <string> using namespace std; int strTsr(string haystack, string needle)

KMP子串查詢演算法

問題：如何在目標字串S中，查詢是否存在子串P？樸素解法： int sub_str_index(const char* s, const char* p)

41 KMP子串查詢演算法

41KMP子串查詢演算法原文：https://www.cnblogs.com/wanmeishenghuo/p/9671794.html參考狄泰軟體相關教程

資料結構/ 串的模式匹配法 / kmp演算法與next陣列的構造

模式匹配的基本思想：存在主串S和模式串T，從S的第pos個字元起和T的第一個字元相比較，若相等，逐個比較後續字元；若不相等，從S的pos+1個字元旗重新依次匹配，直到T中的每個字元和S中的一個連續字元序列相等，即

串——BF演算法（匹配子串）

#include<iostream> #include <cstring> using namespace std; #define MAXLEN 255 /* BF演算法，匹配子串

是否是子串——KMP演算法

技術標籤：演算法字串演算法c++KMPleetcode 文章目錄 1. 引入2. KMP如何避免重複比較2.1 最大字首字尾匹配長度2.2 最大字首字尾匹配長度有何用處

YbtOJ KMP演算法課堂過關例4 子串拆分【KMP】

思路這道題首先可以發現要找最大字串的子串來看是否有ABA型，然後直接超時，發現可以直接列舉左端點，大的子串可以包含小的右端點子串。於是列舉每一個左端點，然後求next，把這個子串中所有ABA找出來，然後找的

【演算法框架套路】滑動視窗演算法：匹配子串

目錄滑動視窗演算法框架套路求最小視窗（縮小後更新結果集）求最大視窗（縮小前更新結果集）python翻譯框架套路求最小視窗求最大視窗示例演算法題最小覆蓋子串題目實現字串全排列子串題目實現找出所有字母異位詞題目

簡單模式匹配/KMP演算法

#include<stdio.h> #define MaxSize 255 typedef struct { char ch[MaxSize]; int length; }SString; void InitStr(SString &S)

演算法資料結構 | 只要30行程式碼，實現快速匹配字串的KMP演算法

本文始發於個人公眾號：TechFlow，原創不易，求個關注今天是演算法資料結構專題的第29篇文章，我們來聊一個新的字串匹配演算法——KMP。

647. 迴文子串（馬拉車演算法）- 8月19日

題目 647. 迴文子串我的思路設兩個指標，遍歷兩個指標之間形成的字串？複雜度n*n*n如何優化

子字串匹配常用演算法總結

前言新開專欄【資料結構拾遺】本專欄旨在快速瞭解常見的資料結構和演算法。在需要使用到相應演算法時，能夠幫助你回憶出常用的實現方案並且知曉其優缺點和適用環境。

【演算法】【字串】Leetcode迴文子串相關題目

最長迴文子串題目連結：https://leetcode-cn.com/problems/longest-palindromic-substring/ class Solution {

最長公共子串演算法(Longest Common Substring)

給兩個字串，求兩個字串的最長子串（例如：“abc”“xyz”的最長子串為空字串，“abcde”和“bcde”的最長子串為“bcde”）

kmp演算法/子串匹配

17.kmp演算法/子串匹配

a.整體框架

講解

結論與演算法

相關推薦