1. 程式人生 > >(3) 用java編譯器實現一個簡單的編譯器-語法分析

(3) 用java編譯器實現一個簡單的編譯器-語法分析

轉載地址:http://blog.csdn.net/tyler_download/article/details/50708807

視訊地址:http://study.163.com/course/courseLearn.htm?courseId=1002830012#/learn/video?lessonId=1003210315&courseId=1002830012

程式碼地址 : https://pan.baidu.com/s/1sjWiwPn

正文內容

語法和解析樹:

舉個例子看看,語法解析的過程。句子:“我看到劉德華唱歌”。在計算機裡,怎麼用程式解析它呢。從語法上看,句子的組成是由主語,動詞,和謂語從句組成,主語是“我”,動詞是“看見”, 謂語從句是”劉德華唱歌“。因此一個句子可以分解成 主語 + 動詞 + 謂語從句:

句子-->主語+動詞 + 謂語從句 

主語是名詞,因此有 :

主語->名詞

句子裡的名詞有: “我”, “劉德華”,因此有解析規則:

名詞-> "我“  |  "劉德華".

句子裡的動詞是“看見”, “唱歌”,由此有解析規則:

動詞-> “看見” | “唱歌”

再看謂語從句,謂語從句由賓語和謂語動片語成, 賓語是 “劉德華”, 謂語動詞是“唱歌", 謂語從句的解析規則就是:

謂語從句 -> 賓語 + 謂語動詞

謂語動詞是屬於動詞,於是又有:

謂語動詞-> 動詞

動詞->”看見” | "唱歌"

這樣,整個句子的解析規則就有:

1.句子-->主語+動詞 + 謂語從句

2.謂語從句 -> 賓語 + 謂語動詞

3.主語->名詞

4.謂語動詞->動詞

5.動詞-> “看見” | “唱歌”

6.名詞-> "我“  |  "劉德華".

上面這組解析規則就是在計算機中用來解析句子的演算法,接下來我們通過一系列替換,從這組規則還原回句子,首先從第一個規則開始,用右邊的式子替換左邊的符號,

1. 句子 通過規則 :句子-->主語+動詞 + 謂語從句 替換得到:

2. 主語+動詞 + 謂語從句, 通過規則 主語->名詞 替換得到:

3. 名詞 + 動詞 + 謂語從句, 通過規則 名詞-> "我“  |  "劉德華" 替換得到

4. 我 + 動詞 + 謂語從句, 通過規則 動詞-> "看見" 替換得到:

5. 我 看見 + 謂語從句, 通過規則 謂語從句 -> 賓語 + 謂語動詞 替換得到:

6. 我 看見 賓語+謂語動詞, 通過規則 賓語->名詞 替換得到:

7. 我 看見 名詞+謂語動詞, 通過規則 名詞-> "我“  |  "劉德華" 替換得到:

8. 我 看見 劉德華 + 謂語動詞, 通過規則 謂語動詞->動詞 替換得到:

9. 我 看見 劉德華 動詞。通過規則 動詞-> “唱歌” 替換得到

10 我 看見 劉德華 唱歌

至此,我們已經沒有可替換的地方,於是語法解析完成。 由此可見,語法解析就是通過設立一組規則,然後判斷輸入的文字是否符合給定規則的過程。我們看到,最底層的一些規則是這樣的:

名詞-> "我“  |  "劉德華", 動詞-> “看見” |“唱歌“

這幾條規則,其實就是以前(http://blog.csdn.net/tyler_download/article/details/50668983)所說的詞法分析,-> 左邊就是標籤,右邊就是詞法分析的字串。整個解析過程,形成了一種樹狀結構,這個結構就叫語法解析樹:

設想,由文字組成的文字,其形式是無窮的,語法解析的規則是將無窮的文字中,選取出組合形式符合語法規則的文字,例如對於上述語法,句子:“我看見張學友唱歌” 就無法通過語法規則,按照上面的替換過程,我們發現,到第7步時 解析到賓語,賓語替換成名詞後無法將名詞替換成“張學友”, 因此“我看見張學友唱歌”對於上面的語法規則而言,是非法輸入。

當然,語法規則所限定的文字輸入也不是唯一的,句子:“劉德華看見我唱歌” 也符合上面的語法規則,大家可以仿照上面的替換過程驗證一下。

如果想要語法識別“我看見張學友唱歌”, 那麼只要將規則改一下:名詞->”我“ | ”劉德華” | “張學友” 即可。

我們看看,將上述替代過程轉成計算機偽碼是怎樣的:

假定“我看見劉德華唱歌” 這歌句子存在緩衝區buffer 裡,那麼程式碼表述如下:

句子(buffer) {

   //主語 + 動詞 + 謂語從句 替換 句子

    主語(buffer);

    動詞(buffer);

   謂語從句(buffer);

}

主語(buffer) {

//名詞 替換 主語

   名詞(buffer);

}

名詞(buffer) {

  // “我” | “劉德華” 替換 名詞

    if (buffer[0] == “我”) {

        buffer = buffer.substring(1);

        return;

  }

 if (buffer[0,1,2] == “劉德華”) {

    buffer = buffer.substring(3);

    return;

 }

throw new Exception (“該語句不符合語法”);

}

動詞(buffer) {

 // “看見” | “唱歌“ 替換 動詞

  if (buffer[0,1]== “看見” || buffer[0,1] == “唱歌") {

    buffer = buffer.substring(2);

    return; 

  }

 throw new Exception (“該語句不符合語法”);

}

謂語從句(buffer) {

//賓語 謂語動詞 替換 謂語從句

    賓語(buffer);

    謂語動詞(buffer);

}

賓語(buffer) {

  //名詞 替換 賓語

    名詞(buffer);

}

謂語動詞(buffer) {

  //動詞 替換 謂語動詞

    動詞(buffer);

}

在下一篇,我們看看,如何對帶有加好和乘號的算術表示式,如何制定一套語法規則以及相應的語法替換程式碼。