NFA構造及NFA轉化為DFA

阿新 • • 發佈：2019-02-01

在前一篇文章DFA演算法的實現與最小化中介紹了DFA,這篇文章將介紹NFA。

1. NFA與DFA的區別

NFA與DFA的主要區別如下:

1) 對於一個特定的符號輸入，DFA只會跳轉到一個狀態；而NFA則可能跳轉到多個狀態。

2) NFA中一個狀態可以不經過任何符號就可以實現狀態轉換(即存在ε-轉移)

上面兩個區別就導致了NFA匹配符號串時經常要回溯，而DFA由於狀態轉移時不存在不確定性，效率比DFA

高很多，但另一方面NFA比DFA更靈活。NFA與DFA之間可以相互轉換，後面將介紹NFA轉換為DFA的演算法。

2. NFA的構造

正如在前一篇文章DFA演算法的實現與最小化中一樣，NFA也繼承了一個抽象類FA，如下所示:

public abstract class FA {
    protected List<FAState> acceptingStates;        //可接收狀態(結束狀態)
    protected List<FAState> states;                    //所有狀態
    protected List<String> alphabet;                //符號字母表
    //狀態轉移矩陣(使用鄰接連結串列表示)
    protected List<List<TransitMatElement>> stateTransitionMat; 

   //....
}

下面是NFA類的定義

public class NFA extends FA {
	//開始狀態
	protected List<FAState> startStates;
        
        //.......
}

之前定義DFA時，開始狀態是用一個FAState型別的變數定義的，而這裡，是用List<FAState>型別定義的。

這是因為DFA只能有一個開始狀態，而NFA可以有多個開始狀態。

構造NFA時，也是需要傳入一個特定格式的文字檔案的路徑作為引數。

只不過由於NFA中可以存在ε-轉移，需要在DFA的狀態轉移矩陣中新增一列，表示一個狀態ε-轉移的情況。

於是我就在DFA狀態轉移矩陣的基礎上在最後一列的後面加上了一列，這反映在用於構造NFA的文字檔案上

就是在DFA基礎上增加了一列。由於之前在前一篇文章中已經詳細地講述過了，

這裡就不再贅述了。
下圖給出了一個NFA的例子:

這個例子與在介紹DFA時列出的例子等價，只不過這裡狀態3遇到a時有兩種狀態轉換方式，

一種是轉向狀態4，另一種是轉向自己。

下面舉例說明另一種型別的NFA，這種NFA是由沒有符號的弧(即ε-轉移)引起的。

對於這個 ε-轉移，我們可以這樣理解: 如果達到了狀態4，可以不看當前的輸入符號就轉移到狀態3。

所以，這是另外一種型別的非確定性。

3.NFA識別符號串

前面介紹過，DFA可以用來識別符號串，同樣，使用NFA也可以。只不過由於NFA的不確定性，

NFA識別符號串的過程中可能會出現回溯。這樣，我們就不得不將NFA識別符號串的過程中達到某一個

狀態後可能跳轉到的所有狀態都儲存起來。於是，我們就選擇用棧來存放這些狀態。

網上NFA識別符號串的例子很多，這裡就不再舉例子了，直接給出NFA識別符號串的核心演算法。

/**
	 * 使用自動機識別符號串(深度優先遍歷)
	 * @param words 待匹配符號串
	 * @return 如果接受，則返回true,否則，返回false 
	 */
	public boolean recognize(String[] words) {
		//對於每一個開始狀態，逐一嘗試，看能否識別輸入的符號串
		for(FAState state: this.startStates) {
			FAState currentState = state;
			int countOfWordsRecognized = 0;		
			// 用於儲存識別的每一步中可能跳轉到的所有狀態
			Stack<FAState> agenda = new Stack<FAState>();
			while(countOfWordsRecognized <= words.length) {
				if(isAccepted(currentState, countOfWordsRecognized, words.length)) {
					return true;				
				} else if(wordsTerminatedButNotAccepted(currentState, words.length, 
						countOfWordsRecognized)) {
					//當前開始狀態下不能識別，嘗試下一個開始狀態
					break;
				} else {
					int indexOfAlpha = 
						this.alphabet.indexOf(words[countOfWordsRecognized]);
					//當前符號串不在符號字母表中，識別失敗
					if(indexOfAlpha < 0) {	
						return false;
					} else {						
						boolean isWordsRecgnized = 
							generateNewStates(currentState, indexOfAlpha, agenda);
						if(isWordsRecgnized) {
							countOfWordsRecognized++;
						}
					}
				}			
				/*選當前開始狀態時，當前步所有可能的狀態都已經嘗試，但未能匹配當前符號串。
				* 嘗試下一個開始狀態 */
				if(agenda.isEmpty()) {  
					break;
				} else {
					currentState = agenda.pop();	//進入下一個狀態
				}
			}	
		}
		return false;
	}

其中函式generateNewStates是用來產生遇到當前符號時可能跳轉到的狀態，並壓入棧中的。其核心程式碼

如下：

/**
	 *  新增指定的狀態遇到對應的符號串時所用可能進入的狀態列表到狀態棧agend
	 * @param state
	 * @param indexOfAlpha
	 * @param agend 存放狀態的棧
	 * @return 當前單詞是否被識別
	 */
	private boolean generateNewStates(FAState state, 
			int indexOfAlpha, Stack<FAState> agend) {
		int indexOfState = this.states.indexOf(state);
		//獲取下標為 indexOfState狀態在狀態轉移矩陣中所對應的行
		List<TransitMatElement> transitMatEleRow = 
				this.stateTransitionMat.get(indexOfState);
		List<FAState> states = new ArrayList<FAState>();
		boolean isWordRecognized = false;
		for(TransitMatElement transEle: transitMatEleRow) {
			//按照遇到的符號串的下標查詢對應的要轉移到的狀態
			if(transEle.getAlphaIndex() == indexOfAlpha) {
				states.add(this.states.get(transEle.getStateIndex()));
				isWordRecognized = true;     //當前單詞被識別
			} else if(transEle.getAlphaIndex() == -1) {  //ε-轉移
				states.add(this.states.get(transEle.getStateIndex()));
			}
		}
		for(FAState curState : states) {
			if(!agend.contains(curState)) {  //當棧中不含有該狀態時，才壓入棧中
				agend.add(curState);
			}
		}
		return isWordRecognized;
	}

4. NFA轉化為DFA

NFA轉化為DFA的一種常用方法是子集法。我是參照《編譯原理及實踐教程》來實現的。這裡，

引用該書中內容來加以闡述。

直接看這些概念應該會很無聊，下面，引用該書中的一個例子，來加以闡述。

相信看了這些概念和例子之後，你就能夠實現NFA轉化為DFA的演算法了。如果還覺得有問題的話，可以

參考我實現的程式碼，可以到這裡下載(注:這裡的程式碼與之前的文章《DFA演算法的實現與最小化》中的程式碼是

一樣的，如果你已經下載了，就不用再下載了)

5.參考資料

1. 《編譯原理及實踐教程》，黃賢英，王柯柯編著

2. 《自然語言處理綜述》， [美 ] Daniel Jurafsky 著

NFA構造及NFA轉化為DFA

在前一篇文章DFA演算法的實現與最小化中介紹了DFA,這篇文章將介紹NFA。 1. NFA與DFA的區別 NFA與DFA的主要區別如下: 1) 對於一個特定的符號輸入，DFA只會跳轉到一個狀態；而NF

【編譯原理第三章重點之一】NFA轉化為DFA

NFA轉化為DFA：書上的虛擬碼：第一步：求初始狀態s通過ε到達的所有點的集合*U[0]；部分程式碼展示： int ii=0,jj=0; int U[ns][ns];for(ii=0;ii<ns;ii++)for(jj=0;jj<n

【編譯原理】把正規式轉化為DFA

整體的步驟是三步：一，先把正規式轉換為NFA（非確定有窮自動機）, 二，在把NFA通過“子集構造法”轉化為DFA，三，在把DFA通過“分割法”進行最小化。一步很簡單，就是反覆運用下圖的規則，圖1 這樣就能轉換到NFA了。&n

【編譯原理】:NFA轉變為DFA的子集構造法

整體的步驟是三步：一，先把正規式轉換為NFA（非確定有窮自動機）, 二，在把NFA通過“子集構造法”轉化為DFA，三，在把DFA通過“分割法”進行最小化。一步很簡單，就是反覆運用下圖的規則，圖1 這樣就能轉換到NFA了。給出一個例題，來自Google

DFA,NFA,GNFA轉化為RG有窮自動機轉正則表示式

一個NFA轉RG的簡單java實現： package hwk2; //import com.alibaba.fastjson.JSON; public class Nfa2Re { // Step1 : Add state S and State A to

編譯原理-NFA構造DFA

img 關系 cat 輸入a mage 重復邏輯 image ati 本題摘自北郵的編譯原理與技術。首先，根據此圖構造狀態轉換表表中第一列第一行表示從第一個符號B通過任意個空轉換能到達的節點，Ia表示由此行的狀態數組（{B，5，1}可以看作0狀態）經過一

NFA確定化為DFA 並最小化DFA

把 NFA 確定化為 DFA 的演算法實現 1）轉換思路由非確定的有限自動機出發構造與之等價的確定的有限自動機的辦法是確定的有限自動機的狀態對應於非確定的有限自動機的狀態集合，即要使轉換後的DFA的每一個狀態對應NFA的一組狀態。該DFA使用它的狀態去記錄在NFA讀入一個輸入符號後可能到達

子集構造法NFA轉換成DFA

教材《編譯原理》（龍書）第2版關於這部分，教材在P94頁有說明，但是我覺得不容易理解，下面通過兩個例題來理解一下。例題一：這一題比較簡單，我們直接從答案找解題方法第一步：要根據NFA畫出這個表格，可能有些模糊，表頭分別為I，Ia，Ib，狀態（是對I這一列自定義的狀

非確定的自動機NFA確定化為DFA

摘要：　在編譯系統中，詞法分析階段是整個編譯系統的基礎。對於單詞的識別，有限自動機FA是一種十分有效的工具。有限自動機由其對映f是否為單值而分為確定的有限自動機DFA和非確定的有限自動機NFA。在非確定的有限自動機NFA中，由於某些狀態的轉移需從若干個可能的後續狀態中進行選擇，故一個NFA對符號串的識別就

python3.x如何從網際網路獲取想要的文章，及轉化為nltk可以處理的文字

from urllib.request import urlopen from bs4 import BeautifulSoup from nltk import word_tokenize import nltk #2種方式解析HTML中的文字 url = "http:/

BIN 轉化為 S19 格式及 S19 格式解析

jquery對象轉化為DOM對象

utf-8 itl html 1.3 title style 操作 query htm <html> <head> <meta http-equiv="Content-type" content="text/html; charset=u

DOM對象轉化為jquery對象

rst asc div head 對象 .com ont content .get <html> <head> <meta http-equiv="Content-type" content="text/html; charset=utf

前端js如何生成一個對象，並轉化為json字符串

cti {} 理解 () min jquery pan i++ 2.0 一，直接上代碼 <script src="../../Content/jquery-2.0.3.min.js" type="text/javascript"></script>

iOS NSDictionary轉化為Json

div json數據 logs str tor datawit Coding font tty p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px Menlo; color: #929292 } span.s1 { }

把int 類型轉化為varchar並且去掉小數點同時以千分號‘，’分割

sel 分號 ast 小數並且轉化 cas convert mon 把int 類型轉化為money 類型，再轉化為varchar，去掉小數點同時以千分號‘，’分割。 select ‘$‘ + left(Convert(VARCHAR, cast(10000 as

如何將CAJ文檔轉化為doc文檔

發送 images alt 如何分享 blog 點擊 png 字體 1.打開CAJ文檔，把你想要復制的字體調整到一頁可以顯示的大小 2.點擊工具欄上面的“文字識別” 3.用鼠標圈住想要顯示復制粘貼的文字 4.就可以隨便了，想要在這個頁面復制粘貼，或者讓發送到word

將自己數據轉化為cifar10支持的lmdb

顯示 c++ track div ifs cat 自己的 align blog 大家都知道，在caffe裏面，要運行cifar10的例子就得先由cifar10的數據庫。由於caffe為了提高運行效率，減少磁盤尋道時間等，統一了數據接口（lmdb，leveldb）。首先，

枚舉與字符串轉及RecordSet轉XML，JSON

function ada records posit archive var toa ole columns function AdoToJs(ado: TADOQuery): string; var I, J: Integer; json: string

C++ unsigned long 轉化為 unsigned char*

border flag 數組指針 bsp cfi add ucf har long C++ Code 123456789101112131415161718 unsigned long lFileLen = 1000;unsigned char *ucF

NFA構造及NFA轉化為DFA

1. NFA與DFA的區別

2. NFA的構造

3.NFA識別符號串

4. NFA轉化為DFA

5.參考資料

相關推薦