文章標題改進的模式匹配演算法

阿新 • • 發佈：2018-11-11

一.演算法功能:
改進的模式演算法是由Knuth,Morris和Pratt等人共同提出的，所以稱為Knuth-Morris-Pratt演算法，簡稱KMP演算法。KMP演算法是字串模式匹配中的經典演算法，在起匹配過程中，主串指標不回溯，從而提高了演算法效能。

二.演算法思想

  1. 在匹配過程中，如果出現不匹配的情況（當前模式串不匹配字元假設為t[i]），首先從已匹配結果計算出目標串S的第i個字元應該與模式串T中哪個字元在比較時出現了不配的情況，即保證在目標串指標不回溯的前提下，確定模式串中新的比較起點。
      設主串是S=’S1S2.....Sn',模式串為T=T1T2.....Tm;
  2.根據模式串T自身的規律和已知當前的位置j，可以歸納出計算模式串新的比較起點k的表示式。令k=next[j]；
           next[j]=0  （當j=1）
           next[j]=max{k|1<k<j且'T1T2.....Tk-1'='Tj-k+1Tj-k+2......Tj-1';
           next[j]=1; 其他情況
           需要說明的是，next[j]中next[0]和next[1]的取值是固定的。
           *匹配規則:*
           （1）當首字母出現不匹配的時候，目標串的指標後移一位，然後在從改位與模式串的第一個字元開始匹配。假定next[0]=-1;
           （2）失配位置j所對應的next[j]的值為接下來要匹配的模式串的字元的索引，也就是說，出現不匹配的時候，模式串的索引指標要回溯到next[j]所對應的位置，而目標串索引指標不回溯。
  3.舉個例子說明:
      例如，現有目標串S='cabdabaabcabaabadcb',模式串T='abaaba'
    1).先把模式串T中可能的失配點j多對應的next[j]計算出來（*由上面的next[j]計算公式*）

      j=1時，next[1]=0;
      j=2時，next[2]=1;
      j=3時，首先，1<k<j,所以k=2;   但是'T1'(此處T1為a)不等於'T2'(此處T2為b),所以next[3]=1;
      j=4時，k={2，3}，k=2時，'T1'='T3'（此處T1等於a,T2等於a)
                                 k=3時,  'T1T2'不等於'T2T3'(此處T1T2是ab,T2T3是ba)
                          因此next[4]=max{k|1<k<j且 'T1T2.....Tk-1'='Tj-k+1Tj-k+2......Tj-1'}=2;
      以此類推
      j=5時，next[5]=2;
      j=6時，next[6]=3;

   2).計算完next[j]的值，接下來開始匹配
       *第一次匹配*:S='*c*abdabaabcabaabadcb'
                          T='*a*baaba'
                 設兩個引數i和j,i代表目標串的指標索引位置，j代表模式串指標索引位置，開始時，i=1,j=1;  第一個字元都不匹配，next[j]=next[1]=0;
          *第二趟匹配*：目標串指標加1，i=2,j=1;
                            S='c*abd*abaabcabaabadcb'
                            T='*aba*aba'
                            匹配失敗時，i=4,j=3;next[j]=1(當j=3時)
          *第三趟匹配*：目標串指標不變，j=1.就是從i=4,j=1開始匹配（此處的原因是上文中的匹配規則）
                            S='cab*d*abaabcabaabadcb'
                            T='*a*baaba'
                           匹配失敗時i=4,j=1,next[j]=0(當j=1時)
         *第四次匹配*：目標串指標加1，模式串指標指向第一個字元，也就是j=1，從i=5,j=1開始匹配。
                           S='cabd*abaabc*abaabadcb'
                           T='*abaaba*'
                           失配時i=10,j=6,next[j]=3(j=6)
          *第五次匹配*：目標串不變，從i=10,j=3,開始匹配，
                            S='cabdabaab*c*abaabadcb'
                            T='ab*a*aba'
                            失配時，i=10,j=3,next[j]=1(j=3)
          *第六次匹配*：目標指標不變，從i=10,j=1,開始匹配，
                              S='cabdabaab*c*abaabadcb'
                              T='*a*baaba'
                               失配時i=10,j=1,next[j]=0;
           *第七次匹配*：目標指標加1，j=1,從i=11,j=1開始匹配
                              S='cabdabaabc*abaaba*dcb'
                              T='*abaaba*'  匹配成功，返回模式串在目標串中的位置11.
            以上匹配過程看起來挺麻煩的，只要一步步慢慢來，是很容易理解的；

三.下面是具體的程式碼實現:

#include<stdio.h>

#define MAXL 255
#define OK 1
#define OVERFLOW -1

typedef unsigned char SString[MAXL + 1];

void strAssign(SString &T, char *s)
//用字元陣列s給串T賦值.
{
    int i = 0;
    T[0] = 0;//0號單元儲存串長.
    for (; s[i]; i++)
    {
        T[i + 1] = s[i];
    }
    T[0] = i;
}

void get_next(SString T, int 
 next[])
{
    //求模式串T的next函式值並存入陣列next中
    int i = 1, j = 0;
    next[1] = 0;
    while (i < T[0])
    {
        if (j == 0 || T[i] == T[j])
        {
            i++; j++;
            next[i] = j;
        }
        else
            j = next[j];
    }
}

int Index_KMP(SString S, SString T)
{
    //求子串T在主串S中可以匹配的位置，不匹配返回0 

    int i = 1, j = 1;
    int next[MAXL];
    get_next(T, next);
    while (i <= S[0] && j <= T[0])
    {
        if (j == 0 || S[i] == T[j])
        {
            i++;
            j++;
        }
        else
            j = next[j];
    }
    if (j > T[0]) return i - T[0];
    else return 0;
}

void main()
{
    int pos;
    SString T, S;
    char char_a[100], char_b[100];
    printf("請輸入主串A：");
    gets_s(char_a);
    printf("%s\n", char_a);
    printf("請輸入主串B：");
    gets_s(char_b);
    printf("%s\n", char_b);

    strAssign(T, char_a);
    strAssign(S, char_b);

    printf("賦值成功！\n");

    pos = Index_KMP(T, S);
    if (pos)
    {
        printf("主串 T=%s 的子串 S=%s 在第%d個位置開始匹配。", char_a, char_b, pos);
    }
    else
        printf("主串 T=%s 和子串 S=%s 不匹配", char_a, char_b);
}

文章標題改進的模式匹配演算法

一.演算法功能: 改進的模式演算法是由Knuth,Morris和Pratt等人共同提出的，所以稱為Knuth-Morris-Pratt演算法，簡稱KMP演算法。KMP演算法是字串模式匹配中的經典演算法，在起匹配過程中，主串指標不回溯，從而提高了演算法效能。二.演算法思想

Brute-Force模式匹配演算法兩種實現方式

1. public static int indexOf(String mainStr,String subString,int start) { if((mainStr.length()<subString.length()) || mainStr==null || subStr

模式匹配演算法思想和實現KMP

首先模式匹配演算法解決的問題是在一個主串和一個模式匹配串中查詢相同的模式匹配串，如果相等，則返回當前模式匹配串的起始位置，否則返回-1 實現思路： /** 首先第一個大前提就是長度第二個是判斷二者是否相等，然後同時後移否則直接回退到i = i - j + 1

JAVA實現KMP模式匹配演算法

獲取next()陣列 /** * 獲取next陣列 * data 主字串 * */ public static int[] getNext(String data){ int[] next=new int[data.length()] ; next [0]=0;

資料結構- 串的模式匹配演算法 BF和 KMP演算法

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

串的樸素演算法和KMP模式匹配演算法

串的樸素演算法和KMP模式匹配演算法串的樸素演算法（BF演算法又稱暴力搜尋）：首先待匹配串與模式串首先左對齊，然後從左向右開始逐個進行匹配，如果出現失配情況，則從待匹配串下一個字元開始進行匹配，直到模式串匹配成功。例如： &nb

演算法4-6：KMP字串模式匹配演算法實現（c語言）

[提交] [統計] [提問] 題目描述 KMP演算法是字串模式匹配演算法中較為高效的演算法之一，其在某次子串匹配母串失敗時並未回溯母串的指標而是將子串的指標移動到相應的位置。嚴蔚敏老師的書中詳細描述了KMP演算法，同時前面的例子中也描述了子串移動位置的陣列實現的演算法。前面你已經實現

資料結構- 串的模式匹配演算法： KMP演算法

1、KMP演算法求解什麼型別問題？字串匹配。給你兩個字串，尋找其中一個字串是否包含另一個字串，如果包含，返回包含的起始位置。 2、完整的KMP演算法 #include <bits/stdc++

【筆記】串的模式匹配演算法

串的模式匹配也稱為子串的定位操作，即查詢子串在主串中出現的位置。設有主串S和子串T，如果在主串S中找到一個與子串T相相等的串，則返回串T的第一個字元在串S中的位置。其中，主串S又稱為目標串，子串T又稱為模式串。本文主要介紹兩種常用的模式匹配演算法，即樸

資料結構——串的模式匹配演算法

2、串的模式匹配演算法串的查詢操作也稱作串的模式匹配操作，模式匹配操作的具體含義是：在主串（也稱作目標串）中，從位置start開始查詢是否存在子串（也稱作模式串），如在主串中查詢到一個與模式串相同的子串，則稱查詢成功；如在主串中為

灰度的影象模式匹配演算法，將一維變為二維...

簡介：本文主要介紹幾種基於灰度的影象匹配演算法：平均絕對差演算法（MAD）、絕對誤差和演算法（SAD）、誤差平方和演算法（SSD）、平均誤差平方和演算法（MSD）、歸一化積相關演算法（NCC）、序貫相似性演算法（SSDA）。下面依次對其進行講解。MAD演算法介紹

串-樸素的模式匹配演算法(java)

樸素的模式匹配演算法實現Java中indexOf(String str, int fromIndex); 即字主字串中查詢目標字串並返回指標地址； public class StringUtils { public static int inde

C/C++——樸素的模式匹配演算法和KMP模式匹配演算法

樸素的模式匹配演算法其實就是一個一個往下匹配，沒有任何優化，在好的情況下時間複雜度為O(n+m)，在最求的情況下時間複雜度為O((n-m+1)*m)。程式碼實現： //在主串s中找子串t，若找

資料結構---串的模式匹配演算法介紹

前言 The years teach much which the days never knew. Time:2017/2/19 Name:Willam 1、介紹對於文字程式來說，找出一個子串在文字中的位置是特別重要的，我們稱那個子串為模式

串(2)--模式匹配演算法

演算法目的：確定子串在主串中第一次出現的位置兩種演算法:BF,KMP(重點掌握) 一:BF演算法 1.特點：主串的指標需回溯,速度慢; 2.演算法思想: 當主串T(長為m)和子串S(長為n)的比較字元不相等時，主串的指標i需要指向之前開始比較的位置的後面一個

C/C++/Java程式碼樸素的(暴力法)模式匹配演算法 KMP演算法資料結構

樸素的模式匹配(暴力法)演算法演算法思想：從目標串的的第一個字元起與模式串的第一個字元比較，若相等，則繼續對字元進行後續的比較，否則目標串從第二個字元起與模式串的第一個字元重新比較，直至模式串中的每個字元依次和目標串中的一個連續的字元序列相等為止，此時稱為匹配

串的模式匹配演算法（BF演算法和KMP演算法）

串的模式匹配演算法子串的定位操作通常稱為串的模式匹配，其中T稱為模式串。一般的求子串位置的定位函式（Brute Force）我寫java的程式碼是這樣的 int index(String S,String T,int pos){

串的模式匹配演算法---BF、KMP

尋找字串S中字串T出現的位置或者次數的問題屬於字串匹配問題。 BF演算法: eg: 主串:s="ababcabcacbab"; 模式串:t="abc"; 1.變數i,j(初始值為0、1都行)分別指向S、T的第一個位置(這裡是指i=1;j=1(i=0;j=0))。 2.

字串模式匹配（簡單模式匹配演算法與KMP演算法）（一）

一般的字串模式匹配演算法是類似下面的逐次匹配，舉例說明如下主串s=ababcabcacbab 從串t=abcac 一般匹配方法如下圖所示程式碼如下 int index(string s,string t) { int i=0,j=0; int

資料結構——串—串的模式匹配演算法

要找到模式串在主串中的位置，最簡單的方法就是一位一位的排查，如果相同，則比較下一項是否相同，一旦出現不同的字元，將剛剛匹配模式串主串的第一位向後移動一位繼續比較，這樣的演算法在某些串中可能會出現多次回溯，所以針對模式串的特點出現了一種改進——演算法KMP演算

文章標題 改進的模式匹配演算法

相關推薦

文章標題改進的模式匹配演算法