軟考進行時——DFA和NFA

阿新 • • 發佈：2019-02-07

理解DFA和NFA
正則表示式引擎分成兩類，一類稱為DFA（確定性有窮自動機），另一類稱為NFA（非確定性有窮自動機）。兩類引擎要順利工作，都必須有一個正則式和一個文字串，一個捏在手裡，一個吃下去。DFA捏著文字串去比較正則式，看到一個子正則式，就把可能的匹配串全標註出來，然後再看正則式的下一個部分，根據新的匹配結果更新標註。而NFA是捏著正則式去比文字，吃掉一個字元，就把它跟正則式比較，匹配就記下來：“某年某月某日在某處匹配上了！”，然後接著往下幹。一旦不匹配，就把剛吃的這個字元吐出來，一個個的吐，直到回到上一次匹配的地方。
DFA與NFA機制上的不同帶來5個影響：
1. DFA對於文字串裡的每一個字元只需掃描一次，比較快，但特性較少；NFA要翻來覆去吃字元、吐字元，速度慢，但是特性豐富，所以反而應用廣泛，當今主要的正則表示式引擎，如Perl、Ruby、Python的re模組、Java和.NET的regex庫，都是NFA的。
2. 只有NFA才支援lazy和backreference等特性；
3. NFA急於邀功請賞，所以最左子正則式優先匹配成功，因此偶爾會錯過最佳匹配結果；DFA則是“最長的左子正則式優先匹配成功”。
4. NFA預設採用greedy量詞（見item 4）；
5. NFA可能會陷入遞迴呼叫的陷阱而表現得效能極差。

我這裡舉一個例子來說明第3個影響。

例如用正則式/perl|perlman/來匹配文字 ‘perlman book’。如果是NFA，則以正則式為導向，手裡捏著正則式，眼睛看著文字，一個字元一個字元的吃，吃完 ‘perl’ 以後，跟第一個子正則式/perl/已經匹配上了，於是記錄在案，往下再看，吃進一個 ‘m’，這下糟了，跟子式/perl/不匹配了，於是把m吐出來，向上彙報說成功匹配 ‘perl’，不再關心其他，也不嘗試後面那個子正則式/perlman/，自然也就看不到那個更好的答案了。

如果是DFA，它是以文字為導向，手裡捏著文字，眼睛看著正則式，一口一口的吃。吃到/p/，就在手裡的 ‘p’ 上打一個鉤，記上一筆，說這個字元已經匹配上了，然後往下吃。當看到 /perl/ 之後，DFA不會停，會嘗試再吃一口。這時候，第一個子正則式已經山窮水盡了，沒得吃了，於是就甩掉它，去吃第二個子正則式的/m/。這一吃好了，因為又匹配上了，於是接著往下吃。直到把正則式吃完，心滿意足往上報告說成功匹配了 ‘perlman’。

由此可知，要讓NFA正確工作，應該使用 /perlman|perl/ 模式。

通過以上例子，可以理解為什麼NFA是最左子式匹配，而DFA是最長左子式匹配。實際上，如果仔細分析，關於NFA和DFA的不同之處，都可以找出道理。而明白這些道理，對於有效應用正則表示式是非常有意義的。

軟考進行時——DFA和NFA

軟考進行時——DFA和NFA

小仙女講軟考之演算法設計和分析

對DFA和NFA的理解以及它們之間的區別

DFA 和 NFA 的區別

DFA和NFA

簡練軟考知識點整理-ABC成本法和ABC分析圖法

系統集成項目經理和高級項目經理資格通過培訓可以獲得，你還需要軟考嗎？

軟考和規劃

41、OrthoMCL和mcl軟件進行基因家族分析

[軟考]之樹和二叉樹

【軟考路上】——用例圖之include和extend

【軟考】解析直接地址索引和間接地址索引

response.Redirect進行頁面的跳轉時所進行的請求和響應的過程

軟考 DFA的狀態轉換圖+正規式

Project Loom:Reactive模型和協程進行時(翻譯)

「補課」進行時：設計模式(3)——和做菜一樣簡單的模版方法模式

軟考（四）

軟考（三）

java獲取mp3的時長和播放mp3文件

Android重寫view時onAttachedToWindow () 和 onDetachedFromWindow ()

軟考進行時——DFA和NFA

相關推薦