kmp演算法易懂

阿新 • • 發佈：2018-11-11

來自http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html

並進行自己的簡單整理，還加了程式碼實現。

因為作者實在太弱，以至自己找了一堆解釋才弄明白，所以按照比較好懂的方式講一講

進入正題。

字串匹配是計算機的基本任務之一。

舉例來說，有一個字串"BBC ABCDAB ABCDABCDABDE"（記為str1），我想知道，裡面是否包含另一個字串"ABCDABD"（記為str2）？

容易想到普通暴搜：

首先，字串"BBC ABCDAB ABCDABCDABDE"的第一個字元與搜尋詞"ABCDABD"的第一個字元，進行比較。因為B與A不匹配，所以搜尋詞後移一位。

因為B與A不匹配，搜尋詞再往後移。

就這樣，直到字串有一個字元，與搜尋詞的第一個字元相同為止。

接著比較字串和搜尋詞的下一個字元，還是相同。

直到字串有一個字元，與搜尋詞對應的字元不相同為止。

這時，暴搜的反應是，將搜尋詞整個後移一位，再從頭逐個比較。這樣做雖然可行，但是效率很差，因為你要把"搜尋位置"移到已經比較過的位置，重比一遍。

一個基本事實是，當空格與D不匹配時，你其實知道前面六個字元是"ABCDAB"。KMP演算法的想法是，設法利用這個已知資訊，不要把"搜尋位置"移回已經比較過的位置，繼續把它向後移，這樣就提高了效率。

在講kmp之前，先引入一個概念--部分匹配值（陣列next）。

首先，要了解兩個概念："字首"和"字尾"。 "字首"指除了最後一個字元以外，一個字串的全部頭部組合；"字尾"指除了第一個字元以外，一個字串的全部尾部組合。

"部分匹配值"就是"字首"和"字尾"的最長的共有元素的長度。以"ABCDABD"為例，

　　－　"A"的字首和字尾都為空集，共有元素的長度為0；

　　－　"AB"的字首為[A]，字尾為[B]，共有元素的長度為0；

　　－　"ABC"的字首為[A, AB]，字尾為[BC, C]，共有元素的長度0；

　　－　"ABCD"的字首為[A, AB, ABC]，字尾為[BCD, CD, D]，共有元素的長度為0；

　　－　"ABCDA"的字首為[A, AB, ABC, ABCD]，字尾為[BCDA, CDA, DA, A]，共有元素為"A"，長度為1；

　　－　"ABCDAB"的字首為[A, AB, ABC, ABCD, ABCDA]，字尾為[BCDAB, CDAB, DAB, AB, B]，共有元素為"AB"，長度為2；

　　－　"ABCDABD"的字首為[A, AB, ABC, ABCD, ABCDA, ABCDAB]，字尾為[BCDABD, CDABD, DABD, ABD, BD, D]，共有元素的長度為0。

"部分匹配"的實質是，有時候，字串頭部和尾部會有重複。比如，"ABCDAB"之中有兩個"AB"，那麼它的"部分匹配值"就是2（"AB"的長度）。搜尋詞移動的時候，第一個"AB"向後移動4位（字串長度-部分匹配值），就可以來到第二個"AB"的位置。

現在來講kmp

這裡是一張匹配表。

已知空格與D不匹配時，前面六個字元"ABCDAB"是匹配的。查表可知，最後一個匹配字元B對應的"部分匹配值"為2，因此按照下面的公式算出向後移動的位數：

　　移動位數 = 已匹配的字元數 - 對應的部分匹配值

因為 6 - 2 等於4，所以將搜尋詞向後移動4位。

因為空格與Ｃ不匹配，搜尋詞還要繼續往後移。這時，已匹配的字元數為2（"AB"），對應的"部分匹配值"為0。所以，移動位數 = 2 - 0，結果為 2，於是將搜尋詞向後移2位。

因為空格與A不匹配，繼續後移一位。

逐位比較，直到發現C與D不匹配。於是，移動位數 = 6 - 2，繼續將搜尋詞向後移動4位。

逐位比較，直到搜尋詞的最後一位，發現完全匹配，於是搜尋完成。如果還要繼續搜尋（即找出全部匹配），移動位數 = 7 - 0，再將搜尋詞向後移動7位，這裡就不再重複了。

最後是程式碼

我們來一部分一部分分開看

先是最重要的next（部分匹配值）

for(int i=2;i<=len2;i++)//處理next
{
    while(i1&&str2[i1+1]!=str2[i])
    //如果str2[i1+1]!=str2[i]那麼這串連續的相等斷了，所以我們無法繼承之前的情況
    {
        i1=next[i1];
   //記得next的含義嗎，順著next我們可以找到能夠讓我們繼續匹配的值，但i1不能為0並且如果我們找到了str2[i1+1]==str2[i]的地方，那麼我們就可以從這裡開始繼承
    }
    if(str2[i1+1]==str2[i])
    {
        i1++;//相等就比下一個，同時這也是計數+1
    }
    next[i]=i1;//把算出的值告訴next
}

其實我覺得kmp十分重要的一點就是理解求next和最後答案的聯絡

所謂next，其實就是自己（str2）和自己（str2）的一個部分匹配值

而最後答案與自己（str2）和別人（str1）的匹配有關

兩者的實質是一樣的，所以如果向下翻，看最後總程式碼的話，可以發現，兩個for迴圈不過就是複製貼上了一下，然後進行稍微改動（建議明白整個演算法後，自行思考改動原因）

當你明白了這點，求str1和str2的匹配就不成問題了

所以我們就可以直接看總程式碼了

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
char str1[1000005],str2[1000005];
int len1,len2,i1;
int next[1000005];
int main()
{
    scanf("%s %s",str1+1,str2+1);
    len1=strlen(str1+1);
    len2=strlen(str2+1);
    for(int i=2;i<=len2;i++)//處理next 
    {
        while(i1&&str2[i1+1]!=str2[i])
        {
            i1=next[i1];
        }
        if(str2[i1+1]==str2[i])
        {
            i1++;
        }
        next[i]=i1;
    }
    i1=0;//別忘初始化
    for(int i=1;i<=len1;i++)//怎麼樣，是不是和求next差不多？
    {
        while(i1&&str2[i1+1]!=str1[i])
        {
            i1=next[i1];
        }
        if(str2[i1+1]==str1[i])
        {
            i1++;
        }
        if(i1==len2)
        {
            printf("%d\n",i-len2+1);//輸出str2在str1中出現的位置
            i1=next[i1];
        }
    }
    for(int i=1;i<=len2;i++)
        printf("%d ",next[i]);
}

kmp到這裡就結束了，歡迎指正錯誤和提問

kmp演算法易懂

來自http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html 並進行自己的簡單整理，還加了程式碼實現。因為作者實在太弱，以至自己找了一堆解釋才弄明白，所以按照比較好懂的方式講一講 &

轉自知乎-我見過最通俗易懂的KMP演算法詳解

有些演算法，適合從它產生的動機，如何設計與解決問題這樣正向地去介紹。但KMP演算法真的不適合這樣去學。最好的辦法是先搞清楚它所用的資料結構是什麼，再搞清楚怎麼用，最後為什麼的問題就會有恍然大悟的感覺。我試著從這個思路再介

KMP演算法（淺顯易懂）

KMP演算法求解什麼型別問題字串匹配。給你兩個字串，尋找其中一個字串是否包含另一個字串，如果包含，返回包含的起始位置。講道理大串A（長度n）小串B（長度m）一般匹配字串，一個一個比，

演算法相關——KMP演算法最通俗易懂的解釋

0. 前言一個字串"BBCABCDABABCDABCDABDE"中是否包含另一個字串"ABCDABD"？ KMP就是最常用的字串匹配演算法之一。KMP有著優秀的時間複雜度O(m+n)，網上有很多KMP演算法的解釋，但讀起來都很費勁。直到讀到Jake Boxer的文章，我才真

通俗易懂的KMP演算法詳解（嚴蔚敏版C語言）

最近，需要複習KMP演算法的next陣列，然後回頭看半年多後的我回頭看半年多前自己綜合別人內容寫的介紹。沒錯，自己也看不懂。然後，自己再根據自己的理解寫了一下理解透徹的筆記，方便理解記憶，當然，以前的程式碼解釋部分可以參考，筆記演算法思維和演算法的實現有

KMP演算法之next函式解釋(大量的反證法和數學歸納法來襲)

先放get_nextval（）函式的程式碼 void get_nextval(const char str[],int *net) { net[0]=-1; int j=0,k=-1,len; len=strlen(str); while(j<len)

一文讀懂 KMP 演算法

來源：阮一峰http://www.ruanyifeng.com/blog/2013/05/Knuth–Morris–Pratt_algorithm.html 字串匹配是計算機的基本任務之一。舉例來說，有一個字串"BBC ABCDAB ABCDABCDABDE"，我想知道，裡面是否包

KMP演算法與其應用

KMP字串匹配題目連結：https://www.luogu.org/problemnew/show/P3375 1.nxt陣列： nxt[x]：以x位結尾的字串為字尾能匹配到的最長字首。求法見程式碼: nxt[1]=0;int j=0; for(int i=2;i<

KMP演算法淺顯理解

說明：轉載 KMP演算法看懂了覺得特別簡單，思路很簡單，看不懂之前，查各種資料，看的稀裡糊塗，即使網上最簡單的解釋，依然看的稀裡糊塗。我花了半天時間，爭取用最短的篇幅大致搞明白這玩意到底是啥。這裡不扯概念，只講演算法過程和程式碼理解： KMP演算法求解什麼型別問題字串匹配。給

hihoCoder week3 KMP演算法

題目連結 https://hihocoder.com/contest/hiho3/problems kmp演算法 #include <bits/stdc++.h> using namespace std; const int N = 1e6 + 10; cha

KMP演算法（字串）

純模板題：HDU1686 #include<cstdio> #include<cstdlib> #include<cstring> #define INF 1000005 int next[INF]; char a[INF],b[INF]; void

KMP演算法最淺顯理解

說明 KMP演算法看懂了覺得特別簡單，思路很簡單，看不懂之前，查各種資料，看的稀裡糊塗，即使網上最簡單的解釋，依然看的稀裡糊塗。我花了半天時間，爭取用最短的篇幅大致搞明白這玩意到底是啥。這裡不扯概念，只講演算法過程和程式碼理解： KMP演算法求解什麼型別問題

有一個文字串S和一個模式串P，要查詢P在S中的位置——KMP演算法

關鍵是求解NEXT陣列 Next陣列就是當前字元之前的字串中，有多大長度的相同字首與字尾 public class KMP { /** * KMP演算法的實現 */ /** * 求解NEXT陣列 */ private static void getNex

leetcode 214 Shortest Palindrome kmp演算法字首字尾字串匹配

0 leetcode 214. Shortest Palindrome 本題的描述是一個串前方加上一些字串，使其成為一個迴文串。形式類似於(新增部分)(迴文部分)(其餘部分)，所以我們的目標就是將其迴文部分求出來，或者把他的長度求出來。如果用暴力解法，那麼問題就變成

KMP 演算法（1）：如何理解 KMP

http://www.61mon.com/index.php/archives/183/ 系列文章目錄 KMP 演算法（1）：如何理解 KMPKMP 演算法（2）：其細微之處一：背景TOC 給定一個主字串（以 S 代替）和模式串（以 P 代替），要

KMP演算法模板 - 構建next最長字首陣列與 kmp核心演算法

#include <iostream> #include <string> using namespace std; //構建next最長字首陣列 int* getNextArray(const string &sub) { if(sub.length() ==

【KMP演算法改進】C++

mark明天來和順便描述一下原本kmp， kmp和bf演算法在文字串 i=0時匹配就成功的話基本相同，且bf不用計算next陣列，、然而bf演算法，如果匹配失敗，會從i=1,i=2,逐個逐個的匹配，浪費時間 kmp演算法，在發現匹配失敗的時候，文字串匹配失敗位置前面的字串是匹配好

菜鷄日記——KMP演算法及其優化與應用

一、什麼是KMP演算法 KMP演算法，全稱Knuth-Morris-Pratt演算法，由三位科學家的名字組合命名，是一種效能高效的字串匹配演算法。假設有主串S與模式串T，KMP演算法可以線上性的時間內匹配出S中的T，甚至還能處理由多個模式串組成的字典的匹配問題。二、KMP演算法原理及實現

python資料結構之KMP演算法的實現

我相信網上已經有很多關於KMP演算法的講解，大致都是關於部分匹配表的實現思路和作用，還有就是目標串的下標不變，僅改變模式串的下標來進行匹配，確實用KMP演算法，當目標串很大模式串很小時，其效率很高的，但都是相對而言。至於對於部分匹配表的作用以及實現思路，建議看一下這篇文章寫的是比較易懂的

字元匹配KMP演算法

KMP是三位大牛：D.E.Knuth、J.H.Morris和V.R.Pratt同時發現的。其中第一位就是《計算機程式設計藝術》的作者！！ KMP演算法要解決的問題就是在字串（也叫主串）中的模式（pattern）定位問題。就是我們平時常說的關鍵字搜尋。模式串就是關鍵字（接下來稱它為T），如果它

kmp演算法易懂

相關推薦