KMP演算法詳細講解

阿新 • • 發佈：2019-01-04

文章篇幅有點長，但是最後一張圖真的很棒，希望讀者堅持慢慢看到最後，必有收穫。

字串單模式問題描述：

給定文字串text,和模式串pattern,在文字串text中找到模式串pattern第一次出現的位置。

一、最基本的字串單模式匹配演算法：暴力求解（Brute Force）:時間複雜度O（m*n）

設文字串text = "ababcabcacbab",模式串為patten = "abcac" 其匹配過程如下圖所示。

黑色線條代表匹配位置，紅色斜槓代表失配位置。

可以看到每次失配之後，模式串都向右移動一位在去從第一個字元開始於文字串匹配。並且

在已經知道很多字元都配不上的情況下，還要這樣移動著去配，是非常浪費時間的。

BF演算法：

int Brute_ForceSearch(string t,string p)
{
int i=0,j=0;
int len = t.length(),len_p = p.length();
while((i <len)&&(j<len_p)){
if(t[i+j]==p[j])///若匹配則模式串後移
j++;
else{///不匹配，則比較下一個位置，模式串回到0位
i++;
j = 0;
}
}
if(j >= len_p)
return i;
return -1;
}

二、KMP演算法的本質。

在BF中，假如從文字串的第i個字元來開始於模式串匹配。當匹配到模式串的第j位發現失配

即text[i+j] != patten[j]的時候，我們又從文字串的第i+1個位置來重新開始匹配。儘管我們已經

知道了好多字元其實根本就匹配不上，我們還是進行了這個過程，這個時候回溯的過程會非常

耗費我們的時間。而KMP演算法的實質就是，當遇到text[i+j] != patten[j]的時候，但是我們知道

模式串中的 0~j-1 位置上的字元已經於i ~ i+j-1位置上的字元是完全匹配的。這樣我們可以在0~j-1

中找到一個字首A和字尾B相等並且最長的那個串，然後將A移動到B的位置再開始重新匹配即可。

這樣就減少了一些不必要的匹配。時間複雜度O（n）

Next陣列的求法：

普及兩個概念：

字首和字尾：例如一個字串：abcd

它的字首有它的字尾有

a d

ab cd

abc bcd

我們這裡所說的字首、字尾不包括字串自身。

求next陣列的時候，對於模式串的位置j，考察patten[j-1].查詢字串patten[j-1]的最大相等的字首和字尾。

假設最大相等字首和字尾長度為k,則有k使得 p[0]p[1]p[2]......p[k-2]p[k-1] = p[j-k]p[j-k+1]......p[j-2]p[j-1]。

例如模式串Patten = "abaabcac"。其next陣列如圖所示：

我們可以看圖中第一個c字元的下標是5，其next陣列的值是2.也就是說，模式串裡面當配到c這個

字元失配的時候，再文字串中,abaab都是已經配好的，我們發現patten前面出現過ab,所以我們從

之前的ab串的後一個字元繼續匹配就行了。如下圖所示：

從圖中我們可以看出藍色位置位置失配，藍色位置前面的字串中，最長公共字首字尾是ab，則我們可以直接

把模式串patten向右滑，讓黃色位置格子於文字串失配的地方對其。則藍色格子失配即模式串第6個字元失配，

就從模式串的第三個字元開始配，第三個字元的下標為2，則next[5] = 2;字串滑過去後如下圖所示。

這樣我們一下滑過去，就跳過了文字串中的text[1],text[2]。避免了這些不必要的匹配。

現在我們開始來講求next陣列。巨集觀上我們按下圖的步驟求next。

我們用index來表示next陣列的下標：

當index = 2時，求ab的最大相等字首串，字尾串。

當index = 3時，求aba的最大相等字首串，字尾串。

當index = 4時，對abaa求最大相等字首串、字尾串。

當j=5時，求abaab的最大相等字首串，字尾串。

。。。。。。。。。。。。。。。。。。不在往後求了，就是按照這樣的方法一直求下去。

看一下程式碼實現：

/*
付完整程式碼
*/
#include <iostream>
#include <string.h>
#include <stdio.h>
using namespace std;
const int maxn = 1000010;
char text[maxn];
char patten[maxn];
int next[maxn];
void GetNext()
{
int len_p = strlen(patten);
next[0] = -1;
int k = -1,j = 0 ;
while(j<len_p)
{
if(k == -1||patten[j] == patten[k])
{
++k;++j;
next[j] = k;
}
else
k = next[k];
}
}
int KMP()
{
int ans=-1,i = 0,j = 0;
int len_p = strlen(patten),n=strlen(text);
while(i<n)
{
if(j==-1||text[i] == patten[j])
{
++i;++j;
}
else
j = next[j];
if(j == len_p){
return i-len_p;
break;
}
}
return ans;
}
int main()
{
int t;
scanf("%d",&t);
while(t--)
{
scanf("%s%s",patten,text);
GetNext();
for(int i = 0; i <strlen(patten); i++)
printf("%d ",next[i]);
printf("\n");
printf("%d\n",KMP());
}
return 0;
}

程式碼測試：

當然大家都直到程式碼該怎麼寫，也知道上面找前後綴的過程，但是肯定看程式碼的時候還是會覺得一臉懵。

想當初我也是這樣的，理解前後綴，但是就是看不懂程式碼，所以為了幫助理解程式碼我又搞了下面這個圖。

這時我這篇部落格裡面最棒的一個圖片了，個人認為：

KMP演算法詳細講解

文章篇幅有點長，但是最後一張圖真的很棒，希望讀者堅持慢慢看到最後，必有收穫。字串單模式問題描述：給定文字串text,和模式串pattern,在文字串text中找到模式串pattern第一次出現的位置。一、最基本的字串單模式匹配演算法：暴力求解（Brute

KMP匹配詳細講解+next陣列真正理解

之前轉載過一篇kuangbin大佬的kmp模板，只會用，但是不清楚原理現在看了某大佬的文章，發現講解的非常精彩，但是有一點不足就是沒講清楚KMP時間複雜度問題，但是自己的語言組織能力以及理解能力也不是很好，所以就直接copyt過來了。希望_july_v博主不介意。http:/

快速排序演算法詳細講解c++版

快速排序演算法 1.首先我需要對快速排序演算法下個定義：什麼是快排呢？或者是排序的指導思想比如一個待排序的陣列 int iArray[] = {5,4,45,878,45}; 我們需要把這個陣列從小到大進行排序。我們首先需要找到

KMP演算法-一個視訊講解很好的很流暢很詳細一定有益

上：http://v.youku.com/v_show/id_XODYxNjExODQ=.html 第 34分鐘開始下：http://www.56.com/u28/v_NjAwMzA0OD

【機器學習】EM演算法詳細推導和講解

眾所周知，極大似然估計是一種應用很廣泛的引數估計方法。例如我手頭有一些東北人的身高的資料，又知道身高的概率模型是高斯分佈，那麼利用極大化似然函式的方法可以估計出高斯分佈的兩個引數，均值和方差。這個方法基本上所有概率課本上都會講，我這就不多說了，不清楚的請百度。　　然而現在我面臨的是這種情況，我

資料結構與演算法(九)：AVL樹詳細講解

資料結構與演算法(一):基礎簡介資料結構與演算法(二):基於陣列的實現ArrayList原始碼徹底分析資料結構與演算法(三):基於連結串列的實現LinkedList原始碼徹底分析資料結構與演算法(四):基於雜湊表實現HashMap核心原始碼徹底分析資料結構與演算法(五):LinkedHashM

KMP演算法最詳細分析！！

1.首先明確，next陣列存在的意義是什麼：示例如下：主串： a b a b c a b c a c b a b 模式串: a b c a c 匹配過程如下: 第一次匹配：這個時候，如果不用KMP，而是用BF，那麼我們的做法很明顯: 嘗試模式串的

《機器學習實戰》第2章閱讀筆記3 使用K近鄰演算法改進約會網站的配對效果—分步驟詳細講解1——資料準備：從文字檔案中解析資料（附詳細程式碼及註釋）

本篇使用的資料存放在文字檔案datingTestSet2.txt中，每個樣本資料佔據一行，總共有1000行。樣本主要包含以下3中特徵：（1）每年獲得飛行常客里程數（2）玩視訊遊戲所耗時間百分比（3）每週消費的冰淇淋公升數在使用分類器之前，需要將處理的檔案格式

kmp演算法關於next陣列的詳細解釋

前言　　　　之前對kmp演算法雖然瞭解它的原理，即求出P0···Pi的最大相同前後綴長度k；但是問題在於如何求出這個最大前後綴長度呢？我覺得網上很多帖子都說的不是很清楚，總感覺沒有把那層紙戳破，後來翻看演算法導論，32章字串匹配雖然講到了對前後綴計算的正確性，但

【轉載】【機器學習】EM演算法詳細推導和講解

今天不太想學習，炒個冷飯，講講機器學習十大演算法裡有名的EM演算法，文章裡面有些個人理解，如有錯漏，還請讀者不吝賜教。　　眾所周知，極大似然估計是一種應用很廣泛的引數估計方法。例如我手頭有一些東北人的身高的資料，又知道身高的概率模型是高斯分佈，那麼利用極大化似然函式的

超級詳細講解匈牙利演算法

二分圖匹配，江湖稱二分匹配，圖論相關演算法。現在給出兩個集合，我們拿約會來舉例子。一方是男生集合，一方是女生集合，女生都比較內斂，對不認識的男孩紙並不喜歡一起約會，所以這裡邊就要有人際關係的問題了。這裡給男生編號n1,n2.....nn;女生編號v1v2....v

【經典演算法】——KMP，深入講解next陣列的求解

前言　　　　之前對kmp演算法雖然瞭解它的原理，即求出P0···Pi的最大相同前後綴長度k；但是問題在於如何求出這個最大前後綴長度呢？我覺得網上很多帖子都說的不是很清楚，總感覺沒有把那層紙戳破，後來翻看演算法導論，32章字串匹配雖然講到了對前字尾計算的正確性，但是大量的推理證明不大好理解，沒有與程式結合

超詳細理解：kmp演算法next陣列求解過程和回溯的含義

前言 KMP演算法是用來求一個較長字串是否包含另一個較短字串的演算法。具體演算法下一篇寫吧，這篇主要解釋next陣列的求解。程式碼程式碼應該都看過了，先貼在這裡，其中最難理解的地方就是求next陣列，以及k往前回溯，這也是寫本文的目的。 in

KMP演算法——基於Youtube外國小哥講解及其Github上程式碼的理解

前言本篇文章是在看了CSDN上那些“大佬”們對KMP演算法的長篇大論後仍然看不懂，而在Youtube上看了一外國小哥講解的視訊後有所領悟，同時想給廣大受苦群眾分享外國小哥的講解而寫的文章。外國小哥關於KMP演算法的Java模板各位可以直接瀏覽以上網

串的應用與kmp演算法講解--學習筆記

串的應用與kmp演算法講解 1. 寫作目的平時學習總結的學習筆記，方便自己理解加深印象。同時希望可以幫到正在學習這方面知識的同學，可以相互學習。新手上路請多關照，如果問題還請不吝賜教。 2. 串的邏輯儲存

Servlet之Filter詳細講解

卸載 response n) 被調用指定負責傳遞 isp quest web.xml中元素執行的順序listener->filter->struts攔截器->servlet。 Java中的Filter過濾器 Filter簡介 Java中的Fil

ASP.NET MVC5路由系統機制詳細講解

提交 eas 找文件網址自動調用提取 ges pri stat 請求一個ASP.NET mvc的網站和以前的web form是有區別的，ASP.NET MVC框架內部給我們提供了路由機制，當IIS接受到一個請求時，會先看是否請求了一個靜態資源（.html,css,js

Android自定義相機超詳細講解

了解 catch 實現 4.4 required form 需要 eset 自己 Android自定義相機超詳細講解轉載請標明出處： http://blog.csdn.net/vinicolor/article/details/49642861；由於網上關於Andr

Plupload 上傳詳細講解，Plupload 多實例上傳，Plupload多個上傳按鈕--推薦使用

.html 目前 clas 路徑 arc 我們參考等等選擇今天幫朋友解決 Plupload 上傳的問題，查了很多資料，資料還是挺全的，但是有點零零散散的，故整理好，合並發出來。本教程包括： Plupload 上傳詳細講。 Plupload 多實例

springmvc4 相關註解的詳細講解

leo pri dao dia sid int lan you ole yii2%E8%A7%A3%E5%86%B3%E7%99%BE%E5%BA%A6%E7%BC%96%E8%BE%91%E5%99%A8umeditor%E5%9B%BE%E7%89%87%E4%B8%8

KMP演算法詳細講解

相關推薦