串匹配問題-BF演算法、KMP演算法、BM演算法

阿新 • • 發佈：2019-02-03

BF演算法

int BF(char A[], char B[]){
    int i = 0, j = 0;
    while(A[i] != '\0' && B[j] != '\0'){
        if(A[i] == B[j]){
            i++;
            j++;
        }else{
            i = i - j + 1;
            j = 0;
        }
    }

    if(B[j] == '\0'){
        return i - j + 1;
    }else{
        return -1;
    }
}

KMP演算法：

int KMP(char A[], char B[]){
    int i = 0, j = 0;
    int next[80];
    GetNext1(B, next);
    while(A[i] != '\0' && B[j] != '\0'){
        if(A[i] == B[j]){
            i++;
            j++;
        }else{
            j = next[j];
            if(j == -1){
                i++;
                j++;
            }

        }
    }
    if(B[j] != '\0'){
        return -1;
    }else{
        return (i - j + 1);
    }


}

KMP演算法獲取next[]值得兩種方法：

方法一：

void GetNext(char B[], int next[]){
    int i , j, len;
    next[0] = -1;
    for(i = 1; B[i] != '\0'; i++){ //依次求next[i]
        for(len = i - 1; len > 0; len--){//len：相等時的字首的最大長度為i-1，不滿足相等時就依次減小 直到找到最大長度 即為next【j】
            for(j = 0; j < len; j++){ //比較B的字首和字尾是否相等
                if(B[j] != B[i - len + j])
                    break;
            }
            if(j == len){//上步for迴圈跳出後，表示j走到了最大相等字首的下一位，也等於字首的長度
                next[i] = len ;
                break;
            }
        }
        if(len < 1){//字首的最大長度為0 時
            next[i] = 0;
        }
    }


}

方法二：

void GetNext1( char B[], int next[]){
    int j = 0, k = -1;
    next[0] = -1;

    while(B[j] != '\0'){
        if(k == -1){ //無相等子串
            j++;
            next[j] = 0;
        }else if(B[j] == B[k]){
            next[++j] = k + 1;

        }else{
            k = next[k];

        }
    }
}

BM演算法：

int BMSearch(char *buf, int blen, char *ptrn, int plen, int *skip, int *shift)
{
    int b_idx = plen;
    if (plen == 0)
        return 1;
    while (b_idx <= blen)//計算字串是否匹配到了盡頭
    {
        int p_idx = plen, skip_stride, shift_stride;
        while (buf[--b_idx] == ptrn[--p_idx])//開始匹配
        {
            if (b_idx < 0)
                return 0;
            if (p_idx == 0)
            {
                return b_idx;  //匹配到
            }
        }
        skip_stride = skip[(unsigned char)buf[b_idx]];//根據壞字元規則計算跳躍的距離
        shift_stride = shift[p_idx];//根據好字尾規則計算跳躍的距離
        b_idx += (skip_stride > shift_stride) ? skip_stride : shift_stride;//取大者
    }
    return 0;
}

BM演算法獲取壞字元表：

int* MakeSkip(char *btrn, int bLen)
{
    int i;
    //為建立壞字元表，申請256個int的空間
    //PS:之所以要申請256個，是因為一個字元是8位，
    // 所以字元可能有2的8次方即256種不同情況
    int *skip = (int*)malloc(256*sizeof(int)); //頭指標

    if(skip == NULL)
    {
        printf("Error");
        return 0;
    }

    //初始化壞字元表，256個單元全部初始化為pLen
    for(i = 0; i < 256; i++)
    {
        *(skip+i) = bLen;
    }

    //給表中需要賦值的單元賦值，不在模式串中出現的字元就不用再賦值了
   //賦值，從左到右遍歷btrn,這樣如果一個字元出現兩次，後面的覆蓋前面的，
    //不在模式中出現的字元不用再賦值，它們使用預設值bLen。
    while(bLen != 0)
    {
        *(skip+(int)*btrn++) = bLen--;
    }

    return skip;
}

BM演算法獲取好字尾表：

int* MakeShift(char* btrn,int bLen)
{
    //為好字尾表申請pLen個int的空間
    //這樣，第一個位置放置長度為1的字尾
    int *shift = (int*)malloc(bLen*sizeof(int));
    int *sptr = shift + bLen - 1;//方便給好字尾表進行賦值的指標
    char *pptr = btrn + bLen - 1;//記錄好字尾表邊界位置的指標
    char c;

    if(shift == NULL)
    {
        printf("Error");
        return 0;
    }

    c = *(btrn + bLen - 1);//儲存模式串中最後一個字元，因為要反覆用到它

    *sptr = 1;//以最後一個字元為邊界時，確定移動1的距離（因為要與壞字元規則比較，所以這個是個假設，1也是最小的移動距離）

    pptr--;//邊界移動到倒數第二個字元

    while(sptr-- != shift)//該最外層迴圈完成給好字尾表中每一個單元進行賦值的工作
    {
        char *p1 = btrn + bLen - 2, *p2,*p3;

        //該do...while迴圈完成以當前pptr所指的字元為邊界時，要移動的距離
        do{
            while(p1 >= btrn && *p1-- != c);//該空迴圈，尋找與最後一個字元c匹配的字元所指向的位置

            p2 = btrn + bLen - 2;
            p3 = p1;

            while(p3 >= btrn && *p3-- == *p2-- && p2 >= pptr);//該空迴圈，判斷在邊界內字元匹配到了什麼位置

        }while(p3 >= btrn && p2 >= pptr);

        *sptr = shift + bLen - sptr + p2 - p3;//儲存好字尾表中，以pptr所在字元為邊界時，要移動的位置

        pptr--;//邊界繼續向前移動
    }

    return shift;
}

主函式：

int main()
{

    char A[] = "abcdesdeacd";
    char B[] = "acd";
    int k = BF(A, B);
    printf("%d\n", k);

    k = KMP(A, B);
     printf("%d\n", k);

    char *T = "abcdesdeacd";
    char *P = "acd";
    int *skip = NULL;
    int *shift = NULL;
    skip = MakeSkip(P, strlen(P));
    shift = MakeShift(P, strlen(P));


    printf("%d\n", BMSearch(T, strlen(T), P, strlen(P), skip, shift) + 1);
    return 0;
}

測試結果：

洛谷 P3375 【模板】KMP字符串匹配 || HDU 1686 Oulipo || kmp

含義發生 cstring .net 這就是 hdu image dba jin HDU-1686 P3375 kmp介紹： http://www.cnblogs.com/SYCstudio/p/7194315.html http://blog.chinaunix.

字符串匹配算法之kmp算法

rri 前綴最大 morris logs 情況長度 ima -1 kmp算法是一種效率非常高的字符串匹配算法，是由Knuth，Morris，Pratt共同提出的模式匹配算法，所以簡稱KMP算法算法思想在一個字符串中查找另一個字符串時，會遇到如下圖的情況我

串的模式匹配演算法---BF、KMP

尋找字串S中字串T出現的位置或者次數的問題屬於字串匹配問題。 BF演算法: eg: 主串:s="ababcabcacbab"; 模式串:t="abc"; 1.變數i,j(初始值為0、1都行)分別指向S、T的第一個位置(這裡是指i=1;j=1(i=0;j=0))。 2.

串匹配問題-BF演算法、KMP演算法、BM演算法

BF演算法int BF(char A[], char B[]){ int i = 0, j = 0; while(A[i] != '\0' && B[j] != '\0'){ if(A[i] == B[j]){

字串匹配問題（BF演算法、KMP演算法）

問題：給定兩個字串S和T，在主串S中查詢子串T的過程稱為串匹配，T稱為模式。 BF演算法（樸素模式匹配）： BF演算法思想：就是將目標串S的第一個字元與模式串T的第一個字元進行匹配，若相等，則繼續比較S的第二個字元和T的第二個字元；若不相等，則比較

【演算法分析】字串匹配：BF、KMP演算法

資料結構-字串匹配（KMP演算法、BF演算法、BM演算法）

本程式碼中用了KMP演算法、BF演算法、BM演算法三種演算法進行字串匹配。文字串儲存在了test.txt中，模式串需自行輸入。程式碼如下：#include"stdio.h" #include"stdio.h" #include"stdlib.h" #include"conio

[從今天開始修煉資料結構]串、KMP模式匹配演算法

[從今天開始修煉資料結構]基本概念 [從今天開始修煉資料結構]線性表及其實現以及實現有Itertor的ArrayList和LinkedList [從今天開始修煉資料結構]棧、斐波那契數列、逆波蘭四則運算的實現 [從今天開始修煉資料結構]佇列、迴圈佇列、PriorityQueue的原理及實現一、什麼是串？　

字串匹配——樸素演算法、KMP演算法

字串匹配（string match)是在實際工程中經常會碰到的問題，通常其輸入是原字串(String)和子串（又稱模式，Pattern)組成，輸出為子串在原字串中的首次出現的位置。通常精確的字串搜尋演算法包括樸素搜尋演算法，KMP, BM(Boyer Moore), sund

串的模式匹配（BF演算法，KMP演算法）

第一位的next值為0，第二位的next值為1，後面求解每一位的next值時，根據前一位進行比較。首先將前一位與其next值對應的內容進行比較，如果相等，則該位的next值就是前一位的next值加上1；如果不等，向前繼續尋找next值對應的內容來與前一位進行比較，直到找到某個位上內容的next

串的模式匹配演算法（BF演算法和KMP演算法）

串的模式匹配演算法子串的定位操作通常稱為串的模式匹配，其中T稱為模式串。一般的求子串位置的定位函式（Brute Force）我寫java的程式碼是這樣的 int index(String S,String T,int pos){

有關串的模式匹配問題中的kmp演算法（俗稱看毛片演算法）

========前言====== 最近準備考研，於是重新拾起資料結構這本書（嚴老師的）對於之前的看毛片演算法想用自己的方式重新總結一下 ========沒有這方面基礎的先看這個網址（該網址為百度百科本人只分享跟連結若有其他影響本人概不負責）

串的樸素演算法和KMP模式匹配演算法

串的樸素演算法和KMP模式匹配演算法串的樸素演算法（BF演算法又稱暴力搜尋）：首先待匹配串與模式串首先左對齊，然後從左向右開始逐個進行匹配，如果出現失配情況，則從待匹配串下一個字元開始進行匹配，直到模式串匹配成功。例如： &nb

KMP——單模式串匹配演算法模板

直接上程式碼，註釋很清晰 #include<bits/stdc++.h> using namespace std; const int MAXN=1000010; int kmp[MAXN]; int la,lb,j; char a[MAXN],b[MAXN]; int

雙目立體視覺匹配演算法-----SAD匹配演算法、BM演算法、SGBM演算法、GC演算法

一、 SAD演算法 1.演算法原理 SAD(Sum of absolute differences)是一種影象匹配演算法。基本思想：差的絕對值之和。此演算法常用於影象塊匹配，將每個畫素對應數值之差的絕對值求和，據此評估兩個影象塊的相似度。該演算法快速、但並不

資料結構- 串的模式匹配演算法： KMP演算法

1、KMP演算法求解什麼型別問題？字串匹配。給你兩個字串，尋找其中一個字串是否包含另一個字串，如果包含，返回包含的起始位置。 2、完整的KMP演算法 #include <bits/stdc++

KMP演算法的經典例題（poj 3461、poj 2752、poj 2406、poj1961）

最簡單的KMP題，找出第一個字串在第二個字串中出現次數。 #include <iostream> #include <cstdio> #include <cstrin

ACM-字串-模式串匹配-KMP演算法

在模式匹配演算法中，KMP是比較常見的單模、高效率演算法之一。在討論KMP之前，先看看樸素的匹配演算法為什麼低效。普通的暴力匹配演算法在每一次匹配失敗之後，僅僅下移一位，並且需要重新判斷整個模式串的每一個字元，見下圖：第一次匹配時，首先會遍歷模式串的每一個字元，但是發現

淺談單模式串字串匹配演算法（KMP）

字串演算法很有趣，尤其是KMP和AC自動機~~ 大綱 1.問題定義字串匹配是電腦科學中最古老、研究最廣泛的問題之一。一個字串是一個定義在有限字母表∑上的字元序列。例如，ATCTAGAGA是字母表∑ = {A,C,G,T}上的一個字串。字串匹配問題就是在一個大的字串

KMP演算法中next陣列、nextval陣列的手工計算

剛接觸資料結構，對於其中的一些演算法都不是很瞭解，這幾天剛在學習串的內容，裡面介紹了兩種串的模式匹配演算法，一種是BF演算法（也叫做BoyFriend演算法）；另一種是KMP演算法（也叫做“看毛片”演算法）。BF演算法的實現很簡單，很暴力，但是在時間複雜度的限制下，這不是一個

串匹配問題-BF演算法、KMP演算法、BM演算法

相關推薦