一、編譯器構造一般原理

阿新 • • 發佈：2018-12-25

一、編譯器概述

1.翻譯器（translator）：把一種語言程式翻譯成另一種語言程式。

2.編譯器（compiler）：高階語言變成低階語言。

3.直譯器（interpreter）：將語句一條一條直接執行，而不生成目的碼。

4.編譯器階段：源程式->詞法分析->語法分析->語義分析->中間程式碼生成器->獨立於機器程式碼優化器->程式碼生成器->依賴於機器程式碼優化器。

5.詞法分析器（lexical analysis，scanner）：

將字元序列轉化為單詞序列（token）的過程，如將position=initial+rate*60轉化，通過詞法分析器轉化為如下

<id,1>，<=>，<id,2>，<+>，<id,3>，<*>，<60>，其中符號表為：1.position，2.initial，3.rate ...

6.語法分析器（syntactic analysis，parser）：

將position=initial+rate*60經過詞法分析得到的序列構造成一棵分析樹（parse tree），如下

符號表：1.position，2.initial，3.rate ...（也包含型別資訊）

7.語義分析器（semantic analysis）：

輸入語法樹，輸出也是語法樹，收集識別符號種屬、型別、儲存位置長度、值、引數返回等資訊，存到符號表中，並進行語義檢查。

8.中間程式碼生成器（intermediate code generator）：將上述語法樹生成中間程式碼如下（三地址指令）

t1=int-to-real(60)

t2=id3*t1

t3=id2+t2

id1=t3

9.程式碼優化器（code optimizer）：中間程式碼優化器可得到如下

t1=id3*60.0

id1=id2+t1

10.程式碼生成器（code generator）：生成彙編程式碼或機器碼。

11.詞法分析器與語法分析器關係：語法分析器作為主程式，呼叫詞法分析器取下一個token，詞法分析器取好返回給語法分析器，在這個過程期間它們都要訪問符號表。（語法分析器後面還可能會呼叫語義分析器）

二、詞法基本概念

1.字母表（alphabet）：表示字母的集合，記號為Σ，若Σ={0,1}則字母表中只有0或1。

2.字母表乘積（product）：Σ1Σ2=Σ3，則Σ3中存在兩個字母，前一個字母在Σ1集合中，後一個字母在Σ2集合中。

3.字母表的冪（power）：字母表的n次冪表示長度為n的符號串構成的集合，這些符號在字母表集合內。

4.字母表閉包（closure）：由字母表中字母構成的所有串（包括空串），若為正（positive）閉包則不包含空串。

5.串（string）：符號的有窮序列，空串記為ε，通常用|s|記作串s的長度。

6.串的連線（concatenation）：如xy連線aa就等於xyaa，即追加串。

7.串的冪：(ab)^3=ababab，任何串0次冪為ε。

8.串的閉包：(ab)*為{ε,ab,abab,ababab,abababab,......}即(ab)^0並(ab)^1並...，若為正閉包則去掉空串。

9.語言（language）：字母表上的一個串集，如{ε,0,00,000}或者Ø。

10.語言的並運算：L∪M=結合了兩種語言的語言。

11.語言的連線運算：LM=每一個句子的前一部分一定屬於L語言，後一部分一定屬於M語言。

12.語言的冪：L^0={ε}，L^i為語言所有句子的i次連線。

13.語言的閉包：L*=L^0並L^1並L^2並....，若正閉包則去掉L^0。

三、文法基本概念

1.文法形式化定義：

G=(Vt,Vn,P,S)

Vt為終結符（terminal symbol）集合，終結符也稱token。

Vn為非終結符（nonterminal）集合，非終結符是表示語法成分的符號。

P為產生式（production）集合，描述了將終結符和非終結符組合成串的方，形式為a→ b，讀作a定義為b，這裡要求a必須包含至少一個非終結符。

S為開始符號（start symbol），表示該文法中最大的語法成分。

文法解決了無窮語言的有窮表示問題。

2.文法的例子：

G=( {id,+,*,(,)} ， {E} ， P ， E )

P={ E→ E+E ， E→ E*E ， E→ (E) ， E→ id }

3.產生式簡寫：a→ b1，a → b2，a → b3 可簡寫為 a → b1 | b2 | b3 。

4.推導（derivations）：A→ B，B → (id) 推導為 A → (id) ，將最大語法成分推導為終結符組成的串。

5.歸約（reductions）：由上例，A → (id) 可歸約為 A→ B ，推導逆操作，將終結符組成的串歸約為最大語法成分。

6.句型（sentential form）：一個句型可包含終結符，又可包含非終結符，也可能是空串。

7.句子（sentence）：不包含非終結符的句型。

8.文法分類：

0型文法（無限制文法）：任意a→ b，a中至少包含1個非終結符，能力相當於圖靈機。

1型文法（上下文有關文法）：0型文法基礎上，任意a→ b，|a| <= |b| （b不等於ε），如 aAb→ axb 上下文有關。

2型文法（上下文無關文法，context-free grammar）：每個產生式左部必須是非終結符，A→ b 。

3型文法（正則文法，regular grammar）：A→ wB或A→ w（右線性），A→ Bw或A→ w（左線性）。

9.上下文無關文法的分析樹：

根為文法開始符號，內部結點為某產生式的左部，一個內部結點和兒子構成了某產生式，分析樹是推導的圖形化表示。

分析樹中根結點對應子樹的邊緣對應句型短語（phrase）本例 id*id+id 。

10.最左推導和最後推導（left/right-most derivation）：

例如給出如下產生式 E→ E+E | E*E | (E) | -E | id

最左推導：推導過程中每次對最左邊的非終結符展開。

E→ -E → -(E) → -(E+E) → -(id+E) → -(id+id)

最右推導（規範推導）：每次對最右邊的非終結符展開。

E→ -E → -(E) → -(E+E) → -(E+id) → -(id+id)

注：最左推導和最右推導的分析樹是一樣的。

11.相同句子分析樹的二義性（同為最左推導）：.

對於產生式 E→ E+E | E*E | (E) | -E | id，要得到句子id*id+id，在最左推導的情況下，可以有這兩種分析樹。

為消除由運算優先順序產生的二義性，可以這樣定義文法

id*id*(id+id) + id*id + id 我們把加式連一塊看作一個expr，把乘式連一塊看作一個term。

id * id * (id+id) 連乘式中每一項看作一個因子factor。

文法就定義為：

expr→ expr+term | term

term→ term*factor | factor

factor→ id | (expr)

例題1：

描述下述語言 L={(a^n) (d^m) (b^n)，n,m>=1}

解：

A→ aAb | aBb 前面的aAb表示可一直延伸ab，即為 ...aaAbb... ，後面的aBb表示B可被d換

B→ dB | d 即表示dd...

例題2：

證明下列文法是一個二義文法

A→ B+B | B

B→ B*B | A | a

解：

對於相同句子a+a*a，同是最左推導時，存在以下兩個不同的分析樹，因此為二義文法。

A →B+B→a+B→a+B*B→a+a*B→a+a*a

A→B→B*B→ A*B→ B+B*B→ a+B*B→ a+a*B→ a+a*a

一、編譯器構造一般原理

一、編譯器概述 1.翻譯器（translator）：把一種語言程式翻譯成另一種語言程式。 2.編譯器（compiler）：高階語言變成低階語言。 3.直譯器（interpreter）：將語句一條一條直接執行，而不生成目的碼。 4.編譯器階段：源程式->詞法分析-

編譯原理（一）編譯器自舉、自展法

前言新興語言井噴，實際上都是踩在前輩肩膀上進行功能特化的結果，本系列從編譯的角度找到語言的共性和不同語言的聯絡。編譯器是將源語言（通常指高階語言）轉換成目標語言的程式，這個程式也是由某種語言寫成並執行的。通常我們希望一個語言的編譯器能夠執行在裸機上而不依賴其他編譯器才

深入理解Lua的閉包一：概念、應用和實現原理

觀點數組 line Language 場景 test 詞法 nil 實參本文首先通過具體的例子講解了Lua中閉包的概念，然後總結了閉包的應用場合，最後探討了Lua中閉包的實現原理。閉包的概念在Lua中，閉包（closure）是由一個函數和該函數會訪問到的

一、掌握Samba服務的配置原理;二、在linux下配置samba共享服務

inter path mage con lob term 禁用域控制器技術分享一、掌握Samba服務的配置原理二、在linux下配置samba共享服務（匿名共享、身份驗證、賬戶映射、訪問控制）Samba介紹：Samba是運行在Linux與Unix之上的免費共享服務的軟

(轉)OpenStack —— 原理架構介紹(一、二)

linu block ORC left tar 4.5 nbsp 管理計算平臺原文:http://blog.51cto.com/wzlinux/1961337 http://blog.51cto.com/wzlinux/category18.html----------

一、考慮使用靜態工廠方法替代構造函數

fault 變化擁有 def enum 可選不能鼓勵 ice 1、何為靜態工廠方法　　靜態工廠方法就是一個返回類實例的靜態方法。比如Boolean的valueof方法： 1 public static final Boolean TRUE = new Boolea

一、基礎篇--1.1Java基礎-Exception、Error、RuntimeException與一般異常有何異同

Throwable、Error、Exception、RuntimeException 關係如下類圖所示： Throwable： Throwable類是java語言中所有錯誤或者異常的超類。它的兩個子類是Error和Exception。 Error： Error是Throwable的子類，

Ajax：一、Asynchronous JavaScript and XML 原理

7.Ajax（Asynchronous JavaScript and XML）原理簡介這是早期從伺服器獲取資料的一種模型結構，當需要載入新的頁面或者展示部分資料時，則必須重新載入頁面。這是一種極差的使用者體驗! 這是一種極差的使用者體驗!

沃趣微講堂 | PXC、MGC&MGR原理與實踐對比（一）

本期課程：PXC、MGC&MGR初相識講師 | 羅小波·沃趣科技高階資料庫技術專家出品 | 沃趣科技七月份，波多老師線下作了一場題為“PXC、MGC&MGR原理與實踐對比”的精彩分享，整場下來，乾貨滿滿，現場的童鞋都聽得灰常

一、python基礎——計算機組成原理及python的產生

一、什麼是計算機計算機：俗稱電腦，是現代一種用於高速計算的電子機器，可以進行數值計算和邏輯判斷，還具有儲存記憶功能，且能夠按照程式的執行，自動、高速處理資料。計算機是20世紀最先進的科學技術發明之一。二、計算機系統由什麼組成 1.1 硬體系統主要

Java----- ArrayList構造、add、remove、clear方法實現原理原始碼分析

一.ArrayList內部的實現方式 ArrayList內部是通過Object[]實現的。二.原始碼分析：（1）.構造方法 public ArrayList() { array = EmptyArray.OBJECT; } p

一、 FrameBuffer 原理、實現與應用寫屏（轉）

一、FrameBuffer 原理、實現與應用一、FrameBuffer的原理 FrameBuffer 是出現在 2.2.xx 核心當中的一種驅動程式介面。 Linux是工作在保護模式下，所以使用者態程序是無法象DOS那樣使用顯示卡BIOS裡提供的中斷呼叫來實

十一、SpringBoot之使用外接的Servlet容器及啟動原理

一、嵌入式和外接Servlet容器對比嵌入式Servlet容器：應用打成可執行的jar 優點：簡單、便攜；缺點：預設不支援JSP、優化定製比較複雜；外接的Servlet容器：外面安裝Tomcat---應用war包的方式打包；二、使用外接的Servlet容

一、 FrameBuffer 原理、實現與應用寫屏

一、FrameBuffer的原理 FrameBuffer 是出現在 2.2.xx 核心當中的一種驅動程式介面。 Linux是工作在保護模式下，所以使用者態程序是無法象DOS那樣使用顯示卡BIOS裡提供的中斷呼叫來實現直接寫屏，Linux抽象出

計算機網路原理筆記（一、概述）

1.概述 1-1.網路(network)由若干結點(node)和連線這些結點的鏈路(link)組成。 1-2.三種通訊方式客戶伺服器方式（C/S 方式）即Client/Server方式

HotSpot設計原理與實現：一、初識HotSpot

global 生命周期類型系統 png 內存分享圖片 tro bsp http 題註：《揭秘Java虛擬機（JVM設計原理與實現）》和《HotSpot實戰》的讀書筆記一、HotSpot內核模塊組成和功能框架1、HotSpot內核模塊圖

C# 模仿QQ、MSN訊息提示系列一、基本原理

QQ、msn訊息提示原理 1、提示框是什麼？提示框就是一個Form視窗 2、提示視窗的顯示狀態是怎樣的？提示視窗在一定時間內從螢幕右下角最下面的位置開始慢慢從下到上移動到整個form框全部顯示然後等待數秒鐘然後在一定時間內從上至下緩緩移出 3、製作這個效果需要用到哪些知識？因為提示視窗是從螢幕右下角

一、影象採集原理

視訊採集　　即將視訊轉換成PC機可使用的數字格式。　　維視專業圖象採集卡是將視訊訊號經過AD轉換後，經過PCI匯流排實時傳到記憶體和視訊記憶體。在採集過程中，由於採集卡傳送資料採用PCIMasterBurst方式，圖象傳送速度高達33MB/S，可實現攝像機影象到計算機記

一、zookeeper詳解概念與原理（總結的乾貨）

ZK總結： zookeeper（以下就用ZK代替）是一個分散式協調系統，主要有兩大功能，檔案系統和通知系統。 1、zk（分散式高性協調系統）: 功能: 配置服務叢集管理名字服務分散式同步釋出訂閱（註冊中心）資料庫動態切換分散式日誌收集分散式

影象特徵檢測描述(一):SIFT、SURF、ORB、HOG、LBP特徵的原理概述及OpenCV程式碼實現

什麼叫特徵檢測？就是檢測影象中目標的特徵唄，所謂特徵，不管你怎麼旋轉目標，離目標遠近，它的特徵都應不變才對，這兩個特性稱為叫旋轉不變性和尺度不變性。當然還有其它特徵，如光照不一樣，也不應該變化嘛，只是旋轉不變性和尺度不變性是最基本的兩個要求。對特徵的描述有很多種方法和運算

一、編譯器構造一般原理

相關推薦