簡單詞法分析器的實現

阿新 • • 發佈：2019-01-16

這是我們的一次程式設計作業，要求用C編寫一個簡單的詞法分析器。要求如下：

編制一個單詞獲取程式，從檔案輸入的源程式中，識別出各個具有獨立意義的單詞，即關鍵字、識別符號、整數、小數、字串、分隔符、運算子等七大類。並依次輸出各個單詞的內部編碼及單詞符號自身文字串（遇到錯誤時可顯示“Error”，然後跳過錯誤部分繼續顯示）。

注意：單詞型別大小寫不敏感（即不區分大小寫）

1、詞法規則

關鍵字： program、const、var、integer、decimal、string、procedure、begin、end 、if、then、else、while、do、call、read、write、not

單詞類別：1

識別符號：字母或“_”打頭的由字母、數字串或“_”組成的任意長度的符號串。

單詞類別：2

整數：數字串。

單詞類別：3

小數：數字串·數字串

單詞類別：4

字串：由一對“”括起來的任意長度的符號串。注意：可以多行。

單詞類別：5

分隔符： {、}、（、）、；、空格

單詞類別：6

運算子： :=、=、<、<=、>、>=、+、-、*、/

單詞類別：7

2、設計詞法分析函式getToken( )，完成以下功能：

1）getToken( )每呼叫一次就分析出一個單詞；

2）返回單詞類別、單詞自身文字串、單詞在原始檔中的行列號；

3、編寫測試程式，反覆呼叫函式getToken ( )，輸出單詞資訊。

以下是程式碼實現：

注意的事項：

　　1，">="這一類操作符要進行判斷。

　　2，小數的識別。為了簡便，我把小數當成字串進行處理，後續可以加上一個字串轉數字的程式，或者直接直接識別成小數。

　　3，輸入的源程式如何判斷結束，我使用的是"#"字元進行判斷，應該可以通過使用EOF進行識別吧。

　　4，超前搜尋指標要回退。

#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;

#define KW 1 //關鍵字
#define ID 2 //識別符號
#define 
 INT 3 //整數
#define FLT 4 //小數
#define STR 5 //字串
#define BRK 6 //分隔符
#define OP 7 //操作符

#define WordLen 100
char prog[80],token[WordLen];
char ch;
int p,j,syn;
int rowNum,lineNum;
char *keyword[18] = {"program","const","var","integer","decimal","string","procedure",
                "begin","end","if","then","else","while","do","call","read","write","not"};

void getToken(){
    for(int i = 0;i < WordLen;i++)
        token[i] = NULL;
    ch = prog[p++];
    /*識別識別符號或者變數名*/
    if(ch >= 'a'&&ch <= 'z'||ch == '_'){
        int i = 0;
        while((ch >= '0'&&ch <= '9')||(ch >= 'a'&&ch <= 'z')||ch == '_'){
            token[i++] = ch;
            ch = prog[p++];
        }
        token [i++] = '\0';
        p--;
        syn = ID;
        for(int n = 0;n < 18 ;n++){
            if(strcmp(token,keyword[n]) == 0){
                syn = KW;
                break;
            }
        }
    }
    /*識別實數*/
    else if(ch >= '0' && ch <= '9'){
        bool isDouble = false; //是否是小數
        j = 0;
        while(ch>='0'&&ch<='9'){
            token[j++] = ch;
            ch = prog[p++];
        }
        if(ch=='.'){
            isDouble = true;
            token[j++] = ch;
            ch = prog[p++];
            while((ch>='0' && ch<='9')){
                token[j++] = ch;
                ch = prog[p++];
            }
        }
        if(isDouble){
            syn = FLT;
        }
        if(!isDouble){
            syn = INT;
        }
        p--;
    }
    /*以下程式碼用於判斷字串*/
    else if(ch == '\"'){
        j = 0;
        token[j++] = ch;
        while(prog[p] != '\"'){
            token[j ++] = prog[p++];
        }
        token[j] = prog[p++];
        //p--;此處p不回退，因為上個while判斷語句沒有進行超前搜尋。
        syn = STR;
    }
    /*以下程式碼用於判斷運算子*/
    else switch(ch){//其他字元
        case'<':
            j = 0;
            token[j++] = ch;
            ch = prog[p++];
            if(ch == '='){
                token[j++] = ch;
                syn = OP;
            }
            else{
                p--;
                syn = OP;
            }
            break;
        case'>':
            j = 0;
            token[j++] = ch;
            ch = prog[p++];
            if(ch == '='){
                token[j] = ch;
                syn = OP;
            }
            else{
                p--;
                syn = OP;
            }
            break;
        case':':
            j = 0;
            token[j++] = ch;
            ch = prog[p++];
            if(ch == '='){
                syn = OP;
                token[j++] = ch;
            }
            else
            {
                syn = -1;
                p--;
            }
            break;
        case '=':syn = OP;token[0] = ch;break;
        case '+':syn = OP;token[0] = ch;break;
        case '*':syn = OP;token[0] = ch;break;
        case '/':syn = OP;token[0] = ch;break;
        case '{':syn = BRK;token[0] = ch;break;
        case '}':syn = BRK;token[0] = ch;break;
        case '(':syn = BRK;token[0] = ch;break;
        case ')':syn = BRK;token[0] = ch;break;
        case ';':syn = BRK;token[0] = ch;break;
        case ' ':syn = BRK;token[0] = ch;break;
        case '\n':syn = -2;rowNum = 0;break;
        case '#':syn = 0;break;
        default :syn = -1;break;
    }
}
int main()
{
    //freopen("D:\\compiler.txt","r",stdin);
    p = 0;
    lineNum = 1;
    gets(prog);
    for(int m = 0;m < sizeof(prog);m++){
        if(prog[m] >= 'A'&&prog[m] <= 'Z'){
            prog[m] = prog[m] - 'A' + 'a';
        }
    }
    do {
        getToken();
        rowNum++;
        switch(syn)
        {
            case 1: cout<<lineNum<<" "<<rowNum<<" "<<"("<<syn<<","<<token<<")"<<endl;break;
            case 2: cout<<lineNum<<" "<<rowNum<<" "<<"("<<syn<<","<<token<<")"<<endl; break;
            case 5: cout<<lineNum<<" "<<rowNum<<" "<<"("<<syn<<","<<token<<")"<<endl; break;
            case 6: cout<<lineNum<<" "<<rowNum<<" "<<"("<<syn<<","<<token[0]<<")"<<endl; break;
            case 3: cout<<lineNum<<" "<<rowNum<<" "<<"("<<syn<<","<<token<<")"<<endl; break;
            case 4: cout<<lineNum<<" "<<rowNum<<" "<<"("<<syn<<","<<token<<")"<<endl; break;
            case -1: cout<<"Error !"<<endl; break;
            case -2: lineNum = lineNum++;break;
            case 0:break;
        }
    }while(syn != 0);
    return 0;
}

簡單詞法分析器的實現

一個簡單詞法分析器的C語言實現

簡單詞法分析器的實現

編譯原理c++簡單詞法分析器

用C語言實現簡單的詞法分析器

編譯原理實驗：實驗一簡單詞法分析程序設計（必修）(Python實現)

編譯原理-詞法分析器1(lex實現)

用python寫一個簡單的詞法分析器

（編譯原理）java實現詞法分析器

一個簡單C語言的詞法分析器

Python 實現的 C 語言詞法分析器

C語言源程式詞法分析器（Java實現）

LEX & FLEX 實現C語言詞法分析器

C++實現詞法分析器（學習）

實驗二詞法分析器的實現

利用LEX實現詞法分析器(vs2010 + Parser Generator版)

最簡單的詞法分析器

C++實現詞法分析器

實現指令碼直譯器 - 詞法分析器

Java 實現《編譯原理》簡單詞法分析功能

詞法分析器——哈工大編譯原理課程（一）

簡單詞法分析器的實現

相關推薦