字串模式匹配KMP演算法

阿新 • • 發佈：2019-01-31

字串模式匹配指的是，找出特定的模式串在一個較長的字串中出現的位置。

樸素的模式匹配演算法

很直觀的可以寫出下面的程式碼，來找出模式串在一個長字串中出現的位置。

   1:  /*

   2:      樸素的模式匹配演算法

   3:      功能：字串的模式匹配

   4:      引數：

   5:          s：目標串

   6:          p：模式串

   7:          pos：開發匹配的位置

   8:      返回值：

   9:          匹配成功，返回模式串在目標串的其實位置

  10:          匹配不成功，返回-1

  11:   
*/

  12:  int match(const char * s ,const  char * p,int pos){

  13:      int i = pos ;

  14:      int j= 0 ;

  15:      while(s[i] != '\0' && p[j] != '\0') {

  16:          if(s[i] == p[j]) {

  17:               i ++ ;

  18:               j ++ ;

  19:          }else {

  20:              i = i - j + 1;

  21:              j = 0 ;

  22:          }

  23:      }

24:

  25:      if(p[j] == '\0')

  26:          return i - j ;

  27:      else

  28:          return -1 ;

  29:  }

上面的程式碼，s就是目標串，p是模式串，pos指定從s的什麼位置開始匹配p。其實現思想也很簡單：

當s[i] == p[j]時，目標串和模式串的指標都向後移動一位，進行匹配。而當s[i] != p[j]時，即匹配不成功時，將目標串和模式串的指標同時回溯，j = 0 而目標串的指標i則回溯到這輪開始的下一個位置。

樸素的模式匹配的演算法複雜度是O( (n-m+1) * m) n為目標串的長度，m為模式串長度。

從其實現思想上可以很容易的看出，造成該演算法低效的地方是在，匹配不成功時主串和模式串的指標回溯上。

有沒有一種演算法，當模式串和主串的匹配不成功時，不用進行指標的回溯，直接進行下一輪的匹配？

ＫＭＰ演算法理解

在樸素的字串模式匹配演算法上，當遇到主串和模式串的字元不能匹配成功時，不論已經匹配了多少字元都要進行指標回溯，再開始下一輪的匹配。

這樣效率是十分的低下的。ＫＭＰ演算法，是在樸素的模式匹配演算法的基礎上，實現了匹配不成功時，不對主串指標進行回溯，使模式匹配的時間複雜度

降低為：O(n + m)。

對KMP演算法的理解，在網上查找了不少資料，也看了演算法導論上的描述，一直是一知半解。有次閒暇之餘，想像著將模式串、主串都看著是條直線，進行了下推導，才恍然大悟。

KMP演算法的核心思想是，在s[i] 和 p[j]不匹配時，不對主串進行指標回溯，而是在模式串中p中尋找k，用s[i] 和 p[k]進行下一輪的匹配。

在這裡，將主串 S 和模式串 P 都看成是一條直線，故而在S[i] 和 P[j] 匹配不成共時，有如下情形：

圖1 s[i] 和 p[j] 匹配不成功

即是：p[1…j-1] == s[i-j+1,…,i-1].

p[j] 和 s[i] 不匹配，現在要在模式串p[1,…,j-1]確定一個位置k（1<= k < j-1)，用p[k]和s[i]進行下一輪匹配，那麼k必須要滿足以下條件：

p[1,..,k-1] == s[i-k+1, … , i-1] .

將模式串和主串都看著一條直線，那麼就有下圖：

圖2 使用p[k]和s[i]進行下一輪匹配

由於 1<= k < j-1，那麼將兩圖合併起來會有什麼效果呢？

從上圖可以看出，當s[i]和p[j]匹配不成功時，假如能用p[k]和s[i]進行下一輪匹配，則有：

s[i-k+1], … , i-1] == p[j-k+1,…,j-1] == p[1,…,k-1] 。

就是說，當s[i] 和 p[j] 匹配不成功時，最對主串不進行指標回溯，而是用p[k]和s[i]進行匹配時，k必須滿足以下條件：

p[1,…,k-1] == p[j-k+1, … , j-1]。

KMP演算法的實現

KMP演算法的是對匹配的模式匹配演算法的改進，在s[i]和p[j]匹配不成功時，不是對主串進行指標的回溯，而是在p[1,…,j-1]中，尋找一個p[k],

用s[i]和p[k]進行下一輪的匹配。其實現的最大問題就是如何的根據p[1,…,j-1]來求出p[k]。

在KMP演算法的實現中，使用一個輔助陣列next[],使用該陣列儲存p[j]匹配不成功時，要進行下一輪匹配的k的值.即是當s[i] 和 p[j]匹配不成功時，

用p[ next[j] ]來和s[i]進行下一輪匹配，k = next[j] .

對陣列next[] 的求解，可以goolge到不少的方法，這裡使用最簡單的遞推的方法：

首先假定next[0] = –1,那麼當next[j] = k時，就有：p[0,…,j-1] == p[j-k+1,…,j-1]。

這時，若有p[k] = p[j] ，則p[0,….,k] = p[j-k+1,..,j-1,j]，從而就有next[j+1] = next[j] + 1 = k +1 .

若p[k] != p[j] ,可以看著模式串對自身進行匹配的問題，即當匹配失敗的時候，k值如何確定，k = next [k] .

求陣列next[ ]的實現如下：

/*
    KMP進行模式匹配的輔助函式
    模式串和主串匹配不成功時，下次和主串進行匹配的模式串的位置
*/
void continue_prefix_function(const char * p , int * next) {
    int j ;
    int k ;
    next[0] = -1 ;
    j = 0 ;
    k = -1 ;

    while(j < strlen(p) - 1) {
        if( k == -1 || p[k] == p[j]) {
            j ++ ;
            k ++ ;
            next[j] = k ;
        }else {
            k =next[k] ;
        }
    }
}

知道了當模式串和主串匹配不成功時，下一個和主串匹配的字元在模式串中的位置，在樸素的模式匹配的基礎上很容易的寫出KMP演算法的程式碼如下：

/*
    運用KMP演算法的字串模式匹配
    在主串和模式串匹配不成功時，不對主串指標進行回溯，
    例如用next[j],來指定下一次和主串進行匹配的模式串的位置
*/
int match_kmp(const char * s ,const char * p,int pos) {
    int next[11] ;
    int i = pos ;
    int j = 0 ;
    continue_prefix_function(p,next) ;
    while(s[i] != '\0' && p[j] != '\0') {
        if(s[i] == p[j]) {
            i ++ ;
            j ++ ;
        }else {
            if(next[j] == -1) {
                i ++ ;
                j = 0 ;
            }
            else {
                j = next[j] ;
            }
        }
    }
    if(p[j] == '\0')
        return i - j ;
    else
        return -1 ;
}

字串模式匹配KMP演算法

字串模式匹配指的是，找出特定的模式串在一個較長的字串中出現的位置。樸素的模式匹配演算法很直觀的可以寫出下面的程式碼，來找出模式串在一個長字串中出現的位置。 1: /* 2: 樸素的模式匹配演算法 3: 功能：字串的模式匹配 4: 引數： 5

字串的匹配 KMP演算法分析

圖片來源於土豆洋芋山藥蛋 https://blog.csdn.net/qq_33414271/article/details/83789478 1.什麼是KMP演算法？在主串Str中查詢模式串Pattern的方法中，有一種方式叫KMP演算法 KMP演算法是在模式

字串模式匹配——KMP

Warning：本文從常見的字串模式匹配開始，以通俗易懂的語言闡述了KMP演算法原理和適用的場景，編寫儘量避免使用晦澀的語言及複雜的數學公式，只為作為學習筆記記錄個人的理解過程，追求理論的同學請繞行到《演算法導論》。 ps：本文是小編一字一字的碼出來的，程式碼

演算法4-6：KMP字串模式匹配演算法實現（c語言）

[提交] [統計] [提問] 題目描述 KMP演算法是字串模式匹配演算法中較為高效的演算法之一，其在某次子串匹配母串失敗時並未回溯母串的指標而是將子串的指標移動到相應的位置。嚴蔚敏老師的書中詳細描述了KMP演算法，同時前面的例子中也描述了子串移動位置的陣列實現的演算法。前面你已經實現

ACM-字串-模式串匹配-KMP演算法

在模式匹配演算法中，KMP是比較常見的單模、高效率演算法之一。在討論KMP之前，先看看樸素的匹配演算法為什麼低效。普通的暴力匹配演算法在每一次匹配失敗之後，僅僅下移一位，並且需要重新判斷整個模式串的每一個字元，見下圖：第一次匹配時，首先會遍歷模式串的每一個字元，但是發現

字串模式匹配中BF演算法和KMP演算法的java實現

關於BF演算法和KMP演算法的具體解釋，文章【部落格地址】：KMP字串匹配演算法與next陣列中有推薦部落格的具體地址，可以在這些部落格中找到詳細的解釋。以下只有具體的java程式碼實現： BF演

字串模式匹配（簡單模式匹配演算法與KMP演算法）（一）

一般的字串模式匹配演算法是類似下面的逐次匹配，舉例說明如下主串s=ababcabcacbab 從串t=abcac 一般匹配方法如下圖所示程式碼如下 int index(string s,string t) { int i=0,j=0; int

字串的模式匹配--BF演算法&KMP演算法

BF演算法是基於主串指標回溯，重新與子串進行逐字元進行比較，主串為S什麼要進行回溯呢，原因在於模式P中存在相同的字元或者說由字元（串）存在重複（模式的部分匹配性質），設想如果模式P中字元各不相同，主串就S的指標就根本不需要回溯；然而，我們可以發現在主串S與模式發

kmp字串模式匹配中next函式值的演算法

j 1 2 3 4 5 6 7 8 模式串 a b a a b c a c next[j] 0 1 1 2 2 3 1 2 各個位的解釋 1.前兩位必定為0和

字串匹配 & KMP演算法

初識KMP 期末的時候學習了KMP演算法，雖然一開始的確聽得是一頭霧水，但是到現在，已經基本懂得了其中的原理，於是在這裡把自己的理解寫出來，再配上自己做的圖示，希望對大家的學習有幫助，要是有什麼疑問或建議，歡迎留言評論。^-^ KMP是一種用於字串匹配的

字串匹配KMP演算法中Next[]陣列求法

int get_nextval(SString T,int &nextval[ ]){ //求模式串T的next函式修正值並存入陣列nextval。 i=1; nextval[1]=0; j=0; while(i<T[0]){

字串匹配——KMP演算法中的next陣列理解

關於原理就不講了，只說下我對Next陣列的理解，希望可以讓你獲得靈光一閃。其實最難的就是是j=Next[j];這麼一句話，當時思考了很長時間，終於明白的時候確實很興奮加得意。 #include<cstdio> #include<cstring> v

字串匹配——KMP演算法的Java實現

開始複習演算法，複習到字串這一結構時，一個經典的問題就是兩個字串的匹配問題。比如：在主串ssdfgasdbababa中找是否存在一個asdba的子串。傳統方法——暴力匹配用傳統的方法就是暴力匹配，從主串中一個個地和子串匹配。最壞的情況下，就是

字串模式匹配--布魯特.福斯演算法視訊講解

2.4、字串模式匹配模式串(或子串)在主串中的定位操作通常稱為串的模式匹配，它是各種串處理系統中最重要的運算之一。2.4.1、布魯特-福斯演算法【基本思想】從主串的第一個字元起與模式串的第一個字元比較，若相等，則繼續逐個字元進行後續比較，否則從主串的第二個字元起

字符串模式匹配KMP算法中的next數組算法及C++實現

完整牛客網 names 數據代碼 str 關於 clu .com 一、問題描述：對於兩個字符串S、T，找到T在S中第一次出現的起始位置，若T未在S中出現，則返回-1。二、輸入描述：兩個字符串S、T。三、輸出描述：字符串T在S中第一次出現的起始位置，若未出現，則

字元匹配KMP演算法

KMP是三位大牛：D.E.Knuth、J.H.Morris和V.R.Pratt同時發現的。其中第一位就是《計算機程式設計藝術》的作者！！ KMP演算法要解決的問題就是在字串（也叫主串）中的模式（pattern）定位問題。就是我們平時常說的關鍵字搜尋。模式串就是關鍵字（接下來稱它為T），如果它

串-模式匹配-KMP

子串的定位操作通常稱作串的模式匹配，是各種串處理系統中最重要的操作之一。演算法有BF蠻力演算法和KMP演算法，KMP演算法的特點是速度快。可以在O（n+m）的時間數量級上完成串的模式匹配操作。演算法思想：與蠻力演算法相比，其改進在於，每當一趟匹配過程中出現字元比較

串-模式匹配-MP演算法

之前學習了KMP演算法，現在學習一下它的弱化版：MP演算法。為啥還要學習它呢？因為它是接下來要學習的AC-自動機的基礎。輸入：主串S,子串T 輸出：主串中子串第一次出現的位置（0-length（S-1））。匹配不到不輸出. 樣例： S：ababcabcacbab

字元匹配 kmp演算法

// KMPTest.cpp : Defines the entry point for the console application. // #include "stdafx.h" #include <iostream> #include &l

字元匹配--KMP演算法

bilibili視訊資料結構實驗之串一：KMP簡單應用 Problem Description 給定兩個字串string1和string2，判斷string2是否為string1的子串。 Input 輸入包含多組資料，每組測試資料包含兩行，第一行代表st

字串模式匹配KMP演算法

相關推薦