BM模式匹配演算法原理（圖解）

阿新 • • 發佈：2019-06-09

BM模式匹配演算法原理（圖解）

首先，先簡單說明一下有關BM演算法的一些基本概念。

BM演算法是一種精確字串匹配演算法（區別於模糊匹配）。

BM演算法採用從右向左比較的方法，同時應用到了兩種啟發式規則，即壞字元規則和好字尾規則，來決定向右跳躍的距離。

BM演算法的基本流程: 設文字串T，模式串為P。首先將T與P進行左對齊，然後進行從右向左比較，如下圖所示:

若是某趟比較不匹配時，BM演算法就採用兩條啟發式規則，即壞字元規則和好字尾規則，來計算模式串向右移動的距離，直到整個匹配過程的結束。

下面，來詳細介紹一下壞字元規則和好字尾規則。

首先，詮釋一下壞字元和好字尾的概念。

請看下圖：

圖中，第一個不匹配的字元（紅色部分）為壞字元，已匹配部分（綠色）為好字尾。

1）壞字元規則（Bad Character）：

在BM演算法從右向左掃描的過程中，若發現某個字元x不匹配，則按如下兩種情況討論：

i. 如果字元x在模式P中沒有出現，那麼從字元x開始的m個文字顯然不可能與P匹配成功，直接全部跳過該區域即可。

ii. 如果x在模式P中出現，則以該字元進行對齊。

用數學公式表示，設Skip(x)為P右移的距離，m為模式串P的長度，max(x)為字元x在P中最右位置。

例1：

下圖紅色部分，發生了一次不匹配。

計算移動距離Skip(c) = 5 - 3 = 2，則P向右移動2位。

移動後如下圖：

2）好字尾規則（Good Suffix）：

若發現某個字元不匹配的同時，已有部分字元匹配成功，則按如下兩種情況討論：

i. 如果在P中位置t處已匹配部分P'在P中的某位置t'也出現，且位置t'的前一個字元與位置t的前一個字元不相同，則將P右移使t'對應t方才的所在的位置。

ii. 如果在P中任何位置已匹配部分P'都沒有再出現，則找到與P'的字尾P''相同的P的最長字首x，向右移動P，使x對應方才P''字尾所在的位置。

用數學公式表示，設Shift(j)為P右移的距離，m為模式串P的長度，j 為當前所匹配的字元位置，s為t'與t的距離（以上情況i）或者x與P''的距離（以上情況ii）。

以上過程有點抽象，所以我們繼續圖解。

例2：

下圖中，已匹配部分cab（綠色）在P中再沒出現。

再看下圖，其後綴T'（藍色）與P中字首P'（紅色）匹配，則將P'移動到T'的位置。

移動後如下圖：

自此，兩個規則講解完畢。

在BM演算法匹配的過程中，取SKip(x)與Shift(j)中的較大者作為跳躍的距離。

BM演算法預處理時間複雜度為O（m+s），空間複雜度為O(s)，s是與P, T相關的有限字符集長度，搜尋階段時間複雜度為O(m·n)。

最好情況下的時間複雜度為O(n/m)，最壞情況下時間

BM模式匹配演算法原理（圖解）

BM模式匹配演算法原理（圖解）首先，先簡單說明一下有關BM演算法的一些基本概念。 BM演算法是一種精確字串匹配演算法（區別於

演算法4-6：KMP字串模式匹配演算法實現（c語言）

[提交] [統計] [提問] 題目描述 KMP演算法是字串模式匹配演算法中較為高效的演算法之一，其在某次子串匹配母串失敗時並未回溯母串的指標而是將子串的指標移動到相應的位置。嚴蔚敏老師的書中詳細描述了KMP演算法，同時前面的例子中也描述了子串移動位置的陣列實現的演算法。前面你已經實現

Struts2工作原理（圖解）

寫在前面：Struts2主要包含前端控制器FC、Action、ValueStack容器、Result、Interceptor攔截器、Tags標籤6個核心元件，本文主要介紹這幾個元件的合作關係，由此構成Struts2的工作流程，以便更好地理解和使用Struts2。背景知識 1、Struts2基礎

RSA演算法原理——（3）RSA加解密過程及公式論證

個人分類：演算法上期（RSA簡介及基礎數論知識）為大家介紹了：互質、尤拉函式、尤拉定理、模反元素這四個數論的知識點，而這四個知識點是理解RSA加密演算法的基石，忘了的同學可以快速的回顧一遍。三、RSA加解密過程及公式論證今天的內容主要分為三

今日頭條演算法原理（全文）

今天，演算法分發已經是資訊平臺、搜尋引擎、瀏覽器、社交軟體等幾乎所有軟體的標配，但同時，演算法也開始面臨質疑、挑戰和誤解。今日頭條的推薦演算法，從2012年9月第一版開發執行至今，已經經過四次大的調整和修改。今日頭條委託資深演算法架構師曹歡歡博士，公開今日頭條的演算法原理，以期推動整

RSA演算法原理（一）

(注意: 博文中部分公式圖片來自維基百科和 google , 需要翻牆檢視) 作者：阮一峰日期： 2013年6月27日如果你問我，哪一種演算法最重因為它是計算機通訊安全的基石，保證了加密資料不會被破解。你可以想象一下，信用卡交易被破解的後果。進

RSA演算法原理（二）

　　33478071698956898786044169 　　84821269081770479498371376 　　85689124313889828837938780 　　02287614711652531743087737 　　814467999489 　　　　× 　　3674604366679959

MySQL索引背後的資料結構及演算法原理（七）

索引選擇性與字首索引既然索引可以加快查詢速度，那麼是不是隻要是查詢語句需要，就建上索引？答案是否定的。因為索引雖然加快了查詢速度，但索引也是有代價的：索引檔案本身要消耗儲存空間，同時索引會加重插入、刪除和修改記錄時的負擔，另外，MySQL在執行時也要消耗資源維護索引，因此索引

BM模式匹配演算法I C++實現

// int BM(char *s,char *t,int *dist,const int lenS,const int lenT) { int i,j,k; i = lenT-1; while(i<lenS) { j = lenT-1; k = i; while(j>=0&&s[

紅黑樹演算法原理（十三）

前言最近斷斷續續花了一個禮拜的時間去看紅黑樹演算法，關於此演算法還是比較難，因為涉及到諸多場景要考慮，同時接下來我們要講解的HashMap、TreeMap等原理都涉及到紅黑樹演算法，所以我們不得不瞭解其原理，關於一些基礎知識這裡不再講解，本文參考博文：《https://www.cnblogs.com/as

串的模式匹配演算法（BF演算法和KMP演算法）

串的模式匹配演算法子串的定位操作通常稱為串的模式匹配，其中T稱為模式串。一般的求子串位置的定位函式（Brute Force）我寫java的程式碼是這樣的 int index(String S,String T,int pos){

字串模式匹配（簡單模式匹配演算法與KMP演算法）（一）

一般的字串模式匹配演算法是類似下面的逐次匹配，舉例說明如下主串s=ababcabcacbab 從串t=abcac 一般匹配方法如下圖所示程式碼如下 int index(string s,string t) { int i=0,j=0; int

KMP模式匹配演算法中next和nextval的求解（轉）

KMP演算法相關轉載自：http://blog.sina.com.cn/s/blog_85b0ae450101j2iy.html KMP演算法由兩部分組成：第一部分，計算模式串的next或nextval陣列。第二部分，利用計算好的模式串的nextval陣列，進行模式

一般的模式匹配演算法（求子串位置）

//一般的模式匹配演算法 #include<stdio.h> int Index (char *s , char *t , int pos );//返回子串t在主串s中第pos個

KMP演算法與樸素模式匹配演算法（C語言）

在上一篇部落格中介紹了KMP演算法和樸素模式匹配演算法的區別，本文主要針對這兩種演算法的C語言實現進行講解。 #include<stdio.h> #define OK 0 #define ERROR -1 #define FAILED 1 in

KMP模式匹配演算法（轉自阮一峰）

字串匹配是計算機的基本任務之一。舉例來說，有一個字串"BBC ABCDAB ABCDABCDABDE"，我想知道，裡面是否包含另一個字串"ABCDABD"？許多演算法可以完成這個任務，Knuth-Morris-Pratt演算法（簡稱KMP）是最常用的之一。它以三個發明者命名，起頭的那個K就是著

常用算法3 - 字符串查找/模式匹配算法（BF & KMP算法）

urn 得出 code input 失敗相等復雜度 acc logs 相信我們都有在linux下查找文本內容的經歷，比如當我們使用vim查找文本文件中的某個字或者某段話時，Linux很快做出反應並給出相應結果，特別方便快捷！那麽，我們有木有想過linux是如何在浩如煙

C++11中的技術剖析（ std bind原理簡單圖解）

簡化靜態成員函數 div 語法 con mar clear 函數多余此文為轉載，好像原出處的原文已經無法打開了。本文解釋了bind 是如何工作的。為了清晰，我對圖中的語法作了一些簡化（例如，省略函數調用操作符的參數類型），並且簡化了 bind 的實現. bin

JVM原理（二）類載入機制與GC演算法

一. 類的載入機制過程將.class的二進位制資料讀入記憶體，放入方法區中在堆中建立一個java.lang.Class物件，封裝類在方法區中的資料結構，並提供訪問方法區資料結構的介面類的生命週期類的載入過程

第k短路演算法詳解（圖解）與模板（A* 演算法）

老規矩，先放模板，有時間放圖解 #include <map> #include <queue> #include <cstdlib> #include <cma

BM模式匹配演算法原理（圖解）

相關推薦