1. 程式人生 > >《編譯原理》學習體會

《編譯原理》學習體會

編譯原理一般認為是較難的一門課.從網上的評論來看,有人說學了一年半軟體理論,就一門編譯看不懂;有人甚至說它是大本軟體課程裡最難的一門;有人抱怨國內的編譯教材沒有一本容易懂的.從筆者學習實踐來看,第一次學了一個多月,理論部分一知半解,第二次學了一星期,基本看懂詞法分析的理論部分,語法分析就一知半解了,第三次學了一星期,才基本看懂詞法分析和語法分析.由此看來,這門課確實有難度.網上有的帖子,把編譯器的編寫搞得高深莫測一般,似乎難度極大,非常人能及.

編譯原理究竟難在哪裡?筆者的體會,主要在這幾點:

1.       錯誤認識: 很多人以為編譯原理只能應用在寫程式語言的編譯器上,覺得用處不大,學習興趣不高.而且可能覺得寫編譯器就必須完全手工來寫.

2.       自動機理論: 象NFA,DFA之類,比較抽象,要費些腦子,特別如果學離散數學時沒有學自動機理論的話,更是需要多花點時間.

3.       集合論的推演: 主要是一些閉包運算之類,數學基礎不好的話,學起來也會感到吃力.

4.       LR文法: 主要是又引入了自動機

不管哪本編譯教材,即使是絕對經典”龍書”也不例外,都要涉及到這幾個難點.由於這些內容本身不好懂,作者有再大的本事,也很難把書寫得象小說那麼流暢好懂.

明確了難點,接著想對策.大致有這麼幾種:

1.       端正認識: 編譯原理在靜態文字處理上有廣泛的應用,舉個簡單的例子,把HTML檔案轉化為純文字,利用編譯原理來實現”非常”簡單.理解了編譯原理的實用性,大概可以提高學習興趣.

2.       反覆看書: 這個辦法看起來最笨,卻是基本的方法.忘了是哪位名人說過,書只要多看,總能看得懂的.

3.       結合原始碼來看: 這是經典教材Compiler Design in C的作者Allen Hollub建議的方法.這本教材的特色就是包含了大段yacc,lex的程式碼.這也是個好方法,而且,只有看懂了程式碼,才能說在根本上理解了理論.當然,要完全看懂yacc的程式碼,工作量是很大的,而且同樣要先理解理論.

4.       刪繁就簡,避重就輕.網上流傳較廣的一篇《編譯原理學習導論》(作者四川大學唐良)就基本是這種思路,對於詞法分析,作者避免了自動機理論和集合論推演的介紹,直接搬出原始碼來,大大降低了理解難度,對於語法分析,作者介紹了遞迴下降和LL文法及相應的原始碼,而對LR文法,只說”理解理論就可以了”.雖然這種方法迴避了對於難點的學習,但是用這種方法學習,可以在較短時間內編寫出一個能夠執行的詞法分析器和語法分析器,可以大大提高學習積極性.

筆者的思路大體上類似第4種方法,但也稍有不同.由於一個偶然的原因, 筆者需要編寫一個詞法分析器和語法分析器,用於程式原始碼的靜態分析.開始無從下手,硬著頭皮看了點編譯原理,覺得困難很大.後來偶然找到一個類似的開源程式,是利用一個叫做PCCTS的編譯器自動生成工具開發的,大受啟發.開源就是好!筆者找來了一個叫做ANTLR的工具(它是PCCTS的新版,支援生成java,c++和c#程式碼),又下載了一個c語言的語法檔案(因為筆者需要處理c程式碼檔案),然後自己編了少量動作(action)語句,介面程式碼,分析處理程式碼等,就這樣,在對編譯原理所知甚少(以前學過的因為理解不深都忘了,只記得正則表示式)的情況下,僅用一個星期就寫出了程式.

這次實踐使筆者對編譯原理興趣大增,重新又學了一遍編譯原理,並歸納出筆者認為比較實用有效的編譯原理學習步驟:

1.       先利用ANTLR之類的編譯器生成工具,做一個小程式(如上面提到的HTML檔案轉化成純文字檔案的程式),所需知識只是正則表示式的基本知識和生成工具本身的使用方法(可以看聯機幫助和網上教程(tutorial)來掌握). 這樣做的好處是:

1)      可以體會到編譯原理的實用性,提高學習興趣

2)      入門容易,消除編譯原理學習的畏難情緒.

3)      獲得詞法分析器和語法分析器的感性認識,有利於加深對理論的理解.

4)      獲得編譯器自動生成工具(compiler compiler)的使用經驗,提高解決實際問題的能力.(實際工作很多都不是手編而是利用工具的)

2.       象ANTLR之類的工具是開源(open source)的,可研究其原始碼,以便必要時自己手編分析程式.

3.       回過頭來看編譯原理教材. 這時大概會發現,很多理論很容易懂,剩下的只有上面說的幾個難點,多看幾遍,重點突破.

4.       結合教材所附原始碼,進一步加深對教材的理解.

這裡順便提一下,有的編譯原理的教材,對於輸入子系統不單立一章來講,有的甚至完全忽略,筆者認為, 輸入子系統相對於詞法分析器和語法分析器來說當然簡單地多,但也是兩者的基礎,故有必要看原始碼來理解.在這方面,ANTLR的實現機制和Lex是不同的(當然和java與c的差異有關),可對照著看.

筆者學習VC++時,深切體會到好教材的重要.筆者開始吃了劣質光碟版”教材”和”21天學VC++”的禍害,看了一個月還如入雲霧之中,後來看了《VC++技術內幕》,方才豁然開朗.但是編譯原理的教材卻似乎質量相差不是特別大,關鍵還在於合適的方法.以上方法筆者也是誤打誤撞總結出來的,希望有所參考價值.