一個簡單詞法分析器的C語言實現

阿新 • • 發佈：2018-12-30

1.1實驗描述

例如：對源程式：

begin x:=9: if x>9 then x:=2*x+1/3; end #

的原始檔，經過詞法分析後輸出如下序列：

<1,begin><10,x><18,:=><11,9><26,;><2,if>……

1.1.1待分析的簡單的詞法

（1）關鍵字：

begin if then while do end

所有的關鍵字都是小寫。

（2）運算子和界符

： = + - * / < <= <> > >= = ; ( ) #

（3）其他單詞是識別符號（ID）和整型常數（SUM），通過以下正規式定義：

ID = letter (letter | digit)*

NUM = digit digit*

（4）空格有空白、製表符和換行符組成。空格一般用來分隔ID、SUM、運算子、界符和關鍵字，詞法分析階段通常被忽略。

1.1.2 各種單詞符號對應的種別碼：

表4.2.1 各種單詞符號對應的種別碼

單詞符號	種別碼	單詞符號	種別碼
bgin	1	：	17
If	2	：=	18
Then	3	<	20
wile	4	<>	21
do	5	<=	22
end	6	>	23
lettet（letter\|digit）*	10	>=	24
dight dight*	11	=	25
+	13	；	26
—	14	(	27
*	15	)	28
/	16	#	0

2.2實現原始碼參考

#include <stdio.h>  
#include <string.h>  
  
char prog[80],token[8],ch;  
int syn,p,m,n,sum;  
char *rwtab[6]={"begin","if","then","while","do","end"};  
   
void scaner(void);  
  
main()  
{  
    p=0;  
    printf("\n please input a string(end with '#'):\n");  
      
    do{  
            scanf("%c",&ch);  
            prog[p++]=ch;  
    }while(ch!='#');  
      
    p=0;  
    do{  
            scaner();  
            switch(syn)  
            {  
                case 11:  
                    printf("( %-10d%5d )\n",sum,syn);  
                break;  
                  
                case -1:  
                    printf("you have input a wrong string\n");  
                    //getch();  
                    return 0;  
                break;  
                  
                default:   
                printf("( %-10s%5d )\n",token,syn);  
                break;  
            }  
        }while(syn!=0);  
    //getch();  
 }  
  
void scaner(void)  
{    
    sum=0;  
      
    for(m=0;m<8;m++)  
        token[m++]= NULL;  
      
        ch=prog[p++];  
        m=0;  
          
    while((ch==' ')||(ch=='\n'))  
        ch=prog[p++];  
      
    if(((ch<='z')&&(ch>='a'))||((ch<='Z')&&(ch>='A')))  
     {   
        while(((ch<='z')&&(ch>='a'))||((ch<='Z')&&(ch>='A'))||((ch>='0')&&(ch<='9')))  
        {  
            token[m++]=ch;  
            ch=prog[p++];  
        }  
          
        p--;  
        syn=10;  
  
        for(n=0;n<6;n++)  
        if(strcmp(token,rwtab[n])==0)  
        {   
            syn=n+1;  
            break;  
        }  
     }  
     else if((ch>='0')&&(ch<='9'))  
     {   
        while((ch>='0')&&(ch<='9'))  
        {  
            sum=sum*10+ch-'0';  
            ch=prog[p++];  
        }  
        p--;  
        syn=11;  
    }  
    else   
    {  
        switch(ch)  
        {  
        case '<':  
            token[m++]=ch;  
            ch=prog[p++];  
            if(ch=='=')  
            {   
                syn=22;  
                token[m++]=ch;  
            }  
            else  
            {    
                syn=20;  
                p--;  
            }  
        break;  
  
        case '>':  
            token[m++]=ch;  
            ch=prog[p++];  
            if(ch=='=')  
            {  
                syn=24;  
                token[m++]=ch;  
            }  
            else  
            {   
                syn=23;  
                p--;  
            }  
        break;  
  
        case '+':  
            token[m++]=ch;  
            ch=prog[p++];  
            if(ch=='+')  
            {  
                syn=17;  
                token[m++]=ch;  
            }  
            else  
            {  
                syn=13;  
                p--;  
            }  
        break;  
  
        case '-':  
            token[m++]=ch;  
            ch=prog[p++];  
            if(ch=='-')  
            {  
                syn=29;  
                token[m++]=ch;  
            }  
            else  
            {   
                syn=14;  
                p--;  
            }  
        break;  
  
        case '!':  
            ch=prog[p++];  
            if(ch=='=')  
            {   
                syn=21;  
                token[m++]=ch;  
            }  
            else  
            {   
                syn=31;  
                p--;  
            }  
        break;  
  
        case '=':  
            token[m++]=ch;  
            ch=prog[p++];  
            if(ch=='=')  
            {  
                syn=25;  
                token[m++]=ch;  
            }  
            else  
            {  
                syn=18;  
                p--;  
            }  
        break;  
  
        case '*':  
            syn=15;  
            token[m++]=ch;  
        break;  
  
        case '/':  
            syn=16;  
            token[m++]=ch;  
        break;  
  
        case '(':   
            syn=27;  
            token[m++]=ch;  
        break;  
  
        case ')':  
            syn=28;  
            token[m++]=ch;  
        break;  
  
        case '{':   
            syn=5;  
            token[m++]=ch;  
        break;  
  
        case '}':   
            syn=6;  
            token[m++]=ch;  
        break;  
  
        case ';':  
            syn=26;  
            token[m++]=ch;  
        break;  
  
        case '\"':  
            syn=30;  
            token[m++]=ch;  
        break;  
  
        case '#':   
            syn=0;  
            token[m++]=ch;  
        break;  
  
        case ':':  
            syn=17;  
            token[m++]=ch;  
        break;  
  
        default:  
            syn=-1;  
        break;  
        }  
    }  
        token[m++]='\0';  
}

1.3小結：

詞法分析，就是將程式原始碼序列，迴圈讀取一個字串，然後根據詞法要求，確定其屬性，然後組成詞法單元。對於現實中的程式語言，其詞法比較複雜，一般用正則表示式表示。

一個簡單詞法分析器的C語言實現

1.1實驗描述例如：對源程式： begin x:=9: if x>9 then x:=2*x+1/3; end # 的原始檔，經過詞法分析後輸出如下序列： <1,begin><10,x><18,:=><11,9><26,;><

詞法分析器-C語言

#include<stdio.h> #include<conio.h> #include<math.h> #include<string.h> #include<stdlib.h> int i, row = 0, line = 0

簡單工廠模式C語言實現

【程式碼清單】 typedef.h #ifndef __TYPEDEF_H__ #define __TYPEDEF_H__ #include <stdio.h> #include <stdlib.h> #ifdef __cplusplus ex

用C語言實現簡單的詞法分析器

詞法分析器又稱掃描器。詞法分析是指將我們編寫的文字程式碼流解析為一個一個的記號，分析得到的記號以供後續語法分析使用。詞法分析器的工作是低級別的分析：將字元或者字元序列轉化成記號.。要實現的詞法分析器單詞符號及種別碼對照表：單詞符號 # begin if then wh

用c語言實現一個簡單的通訊錄

通訊錄的c語言實現原始碼簡單通訊錄的實現還是包括三個原始檔，test.c（實現通訊錄主邏輯），txl.c（實現用到的各個函式），txl.h（存放txl中用到的各種標頭檔案與宣告）。 txl.h #ifndef __TXL_H__//**txl.h** #defi

用C語言寫一個簡單的三子棋，實現玩家與電腦的對戰

原始碼： #define _CRT_SECURE_NO_WARNINGS #include <stdio.h> #include <windows.h> #include <time.h> /* 用 C 寫一個三子棋 */ //邏輯： //1. 畫

JAVA實現一個簡單的代數運算語言編譯器（二）--詞法分析準備

上一篇文章主要介紹了這個代數運算編譯器的起因，這一篇我們就來開始寫這個專案。首先我們需要先設定一些系統的基礎類如系統符號類，保留字類、錯誤提示資訊類、自定義異常、輸入讀取類等，下面簡單地說一下這幾個類。系統符號類： package com.liu.system; /

C語言-------實現一個簡單的單向連結串列

編寫一個連結串列程式,在程式中實現簡單的功能#include <stdio.h> #include <stdlib.h> struct node{ int num; char name[20]; struct node* nex

C語言實現一個簡單的伺服器

C/S結構流程圖服務端 socket函式為了執行網路I/O，一個程序必須做的第一件事情就是建立一個socket函式 /* family 表示協議族 AF_INET(IPv4協議)、AF_INET6(IPv6協議)、AF_L

C語言源程式詞法分析器（Java實現）

一. 介紹詞法分析器，又稱掃描器，輸入源程式，進行詞法分析，輸出單詞符號。詞法分析僅僅是編譯程式工作中的一部分，編譯程式一般可以劃分為5個階段：詞法分析，語法分析，語義分析與中間程式碼產生，優化，目的碼生成。我們這裡編寫一個簡單的C語言源程式詞法分析器。

一個簡單的接收快取設計——C語言實現

#include "string.h" #include "stdlib.h" #include "stdio.h" /************************/ #include "SYS_ENUM.h" #include "LoopRecBuff.h" /***

C語言實現一個最簡單的佇列

1、佇列.h #include<stdio.h> #include<stdlib.h> #define N 100 //定義佇列最大多少個 #define datatype char //定義佇列的資料型別 struct

C語言實現將一個字符串翻轉

spa highlight amp false main lag temp break bcd 問題：對於字符串char* = " abcd efg h"; 要求輸出" h efg abcd "; 字符串整體翻轉，但是裏面每一個單詞的順序不翻轉思想：&

windows網絡編程-C語言實現簡單的UDP協議聊天

無連接 ipv4地址 ast 電腦 tdi data rcp proto 生生　　與TCP協議下編寫服務端程序代碼類似，但因為是無連接的形式，所以不需要監聽。　　這次，我用了一點不同的想法：我建立一個服務端，用了兩個端口和兩個套接字，把服務端作為一個數據轉發的中轉站，

c語言實現簡單web服務器

tps gate choices found lte expect inf tro condition 1http簡單介紹http超文本傳輸協議:host主機地址:port端口/urlhost會被DNS服務器解析成IP地址,所以有時候可以直接用域名,http默認訪問80端

使用C語言實現一個虛擬機

doesn 寄存器 php 浪費 vid c11 machine 指向編程語言使用C語言實現一個虛擬機 2015-6-22 21:32| 發布者: joejoe0332| 查看: 2891| 評論: 0|原作者: leoxu, Serval, 社會主義好, los

C語言實現Socket簡單通信

簡單置0 tin led AS accep sin ive receive 服務端 #include<stdio.h> #include<stdlib.h> #include<errno.h> #include<string.h

C語言實現聊天工具鐘的抖動窗口功能，代碼很簡單，思路也很簡單

.com 微信公眾號 eight 後來這就是 get -i 答案 ros 想必都知道QQ聊天對話框中，有一個抖動個功能，相信大家也都用過，但能否用C語言做出來呢？答案肯定是可以的！至於如何，今天就為大家分享出來！這就是今天的主題。制作流程：簡直簡單的小編都不好意思說

C語言實現簡單的三子棋小遊戲

函式實現的基本功能： 1.初始化棋盤：用空字元初始化 2.列印棋盤：控制列印九宮格來表示棋盤 3.玩家下棋：用P表示玩家的棋子 4.電腦隨機下棋：隨機生成座標，用0表示玩家的棋子 5.判斷輸贏：玩家贏，電腦贏，平局，繼續遊戲四種情況多檔案實現：測試部分test.

c語言實現一個函式，判斷一個數是不是素數

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

一個簡單詞法分析器的C語言實現

相關推薦