C語言第三方庫Melon開箱即用之詞法分析器使用

阿新 • • 發佈：2021-02-16

之前的文章中，筆者介紹了Linux/UNIX C語言庫Melon的基本功能及框架使用。

本文將介紹Melon中的詞法分析器元件。

Melon的Github倉庫為：https://github.com/Water-Melon/Melon
在這裡插入圖片描述
詞法分析器在Melon中並不依賴於自身框架，因此可以在不初始化框架的情況下即可使用。

基礎使用

我們先來看一個基本例子：

//lexer.c

#include <stdio.h>
#include "mln_lex.h"

MLN_DEFINE_TOKEN_TYPE_AND_STRUCT 
(static, mln_test, TEST);
MLN_DEFINE_TOKEN(mln_test, TEST);

int main(int argc, char *argv[])
{
    if (argc != 2) {
        fprintf(stderr, "Usage: %s file_path\n", argv[0]);
        return -1;
    }

    mln_string_t path;
    mln_lex_t *lex = NULL;
    struct mln_lex_attr lattr;
    mln_test_struct_t * 
ts;

    mln_string_nSet(&path, argv[1], strlen(argv[1]));
    lattr.pool = mln_alloc_init();
    if (lattr.pool == NULL) {
        fprintf(stderr, "init memory pool failed\n");
        return -1;
    }
    lattr.keywords = NULL;
    lattr.hooks = NULL;
    lattr.preprocess = 0;
    lattr. 
padding = 0;
    lattr.type = M_INPUT_T_FILE;
    lattr.data = &path;

    mln_lex_initWithHooks(mln_test, lex, &lattr);
    if (lex == NULL) {
        fprintf(stderr, "lexer init failed\n");
        return -1;
    }

    while (1) {
        ts = mln_test_token(lex);
        if (ts == NULL || ts->type == TEST_TK_EOF)
            break;
        write(STDOUT_FILENO, ts->text->data, ts->text->len);
        printf(" line:%u type:%d\n", ts->line, ts->type);
    }

    mln_lex_destroy(lex);
    mln_alloc_destroy(lattr.pool);

    return 0;
}

如此，即可完成一個詞法解析器程式，它讀取程式的引數所指定的檔案的內容，然後解析成詞素，並將其打印出來。

我們執行：

$ ./lexer lexer.c

/ line:1 type:21
/ line:1 type:21
lexer line:1 type:5
. line:1 type:20
c line:1 type:5
# line:3 type:9
include line:3 type:5
< line:3 type:24
stdio line:3 type:5
. line:3 type:20
h line:3 type:5
> line:3 type:26
...

可以看到，這個程式將我們的示例C程式拆解成各種詞素，如：/，#，<等等。

進階使用

上面的例子可以看到，基礎的詞法解析器解析出的詞素過於細碎，有時我們還希望解析器支援我們自定義的關鍵字、自定義格式的資料，甚至是一些預處理功能，例如引入其他檔案的內容解析詞素。

那麼，我們就將上面的例子進行一番修改：

//lexer.c

#include <stdio.h>
#include "mln_lex.h"

mln_string_t keywords[] = {
    mln_string("on"),
    mln_string("off"),
    mln_string(NULL)
};

MLN_DEFINE_TOKEN_TYPE_AND_STRUCT(static, mln_test, TEST, TEST_TK_ON, TEST_TK_OFF, TEST_TK_STRING);
MLN_DEFINE_TOKEN(mln_test, TEST, {TEST_TK_ON, "TEST_TK_ON"}, {TEST_TK_OFF, "TEST_TK_OFF"}, {TEST_TK_STRING, "TEST_TK_STRING"});

static inline int
mln_get_char(mln_lex_t *lex, char c)
{
    if (c == '\\') {
        char n;
        if ((n = mln_lex_getAChar(lex)) == MLN_ERR) return -1;
        switch ( n ) {
            case '\"':
                if (mln_lex_putAChar(lex, n) == MLN_ERR) return -1;
                break;
            case '\'':
                if (mln_lex_putAChar(lex, n) == MLN_ERR) return -1;
                break;
            case 'n':
                if (mln_lex_putAChar(lex, '\n') == MLN_ERR) return -1;
                break;
            case 't':
                if (mln_lex_putAChar(lex, '\t') == MLN_ERR) return -1;
                break;
            case 'b':
                if (mln_lex_putAChar(lex, '\b') == MLN_ERR) return -1;
                break;
            case 'a':
                if (mln_lex_putAChar(lex, '\a') == MLN_ERR) return -1;
                break;
            case 'f':
                if (mln_lex_putAChar(lex, '\f') == MLN_ERR) return -1;
                break;
            case 'r':
                if (mln_lex_putAChar(lex, '\r') == MLN_ERR) return -1;
                break;
            case 'v':
                if (mln_lex_putAChar(lex, '\v') == MLN_ERR) return -1;
                break;
            case '\\':
                if (mln_lex_putAChar(lex, '\\') == MLN_ERR) return -1;
                break;
            default:
                mln_lex_setError(lex, MLN_LEX_EINVCHAR);
                return -1;
        }
    } else {
        if (mln_lex_putAChar(lex, c) == MLN_ERR) return -1;
    }
    return 0;
}

static mln_test_struct_t *
mln_test_dblq_handler(mln_lex_t *lex, void *data)
{
    mln_lex_cleanResult(lex);
    char c;
    while ( 1 ) {
        c = mln_lex_getAChar(lex);
        if (c == MLN_ERR) return NULL;
        if (c == MLN_EOF) {
            mln_lex_setError(lex, MLN_LEX_EINVEOF);
            return NULL;
        }
        if (c == '\"') break;
        if (mln_get_char(lex, c) < 0) return NULL;
    }
    return mln_test_new(lex, TEST_TK_STRING);
}

int main(int argc, char *argv[])
{
    if (argc != 2) {
        fprintf(stderr, "Usage: %s file_path\n", argv[0]);
        return -1;
    }

    mln_string_t path;
    mln_lex_t *lex = NULL;
    struct mln_lex_attr lattr;
    mln_test_struct_t *ts;
    mln_lex_hooks_t hooks;

    memset(&hooks, 0, sizeof(hooks));
    hooks.dblq_handler = (lex_hook)mln_test_dblq_handler;

    mln_string_nSet(&path, argv[1], strlen(argv[1]));

    lattr.pool = mln_alloc_init();
    if (lattr.pool == NULL) {
        fprintf(stderr, "init pool failed\n");
        return -1;
    }
    lattr.keywords = keywords;
    lattr.hooks = &hooks;
    lattr.preprocess = 1;//支援預處理
    lattr.padding = 0;
    lattr.type = M_INPUT_T_FILE;
    lattr.data = &path;

    mln_lex_initWithHooks(mln_test, lex, &lattr);
    if (lex == NULL) {
        fprintf(stderr, "lexer init failed\n");
        return -1;
    }

    while (1) {
        ts = mln_test_token(lex);
        if (ts == NULL || ts->type == TEST_TK_EOF)
            break;
        write(STDOUT_FILENO, ts->text->data, ts->text->len);
        printf(" line:%u type:%d\n", ts->line, ts->type);
    }

    mln_lex_destroy(lex);
    mln_alloc_destroy(lattr.pool);

    return 0;
}

這一次，我們增加如下功能：

支援關鍵字 on和off
支援識別雙引號擴住的內容為字串型別
增加了預處理功能，例如引入其他檔案內容

生成可執行程式：

$ cc -o a a.c -I /usr/local/melon/include/ -L /usr/local/melon/lib/ -lmelon -lpthread

建立兩個測試檔案：

a.ini

#include "b.ini"
test_mode = on
log_level = 'debug'
proc_num = 10

b.ini

conf_name = "b.ini"

執行我們的程式來看看效果：

$ ./lexer a.ini

conf_name line:1 type:5
= line:1 type:25
b.ini line:1 type:42
test_mode line:2 type:5
= line:2 type:25
on line:2 type:40
log_level line:3 type:5
= line:3 type:25
' line:3 type:13
debug line:3 type:5
' line:3 type:13
proc_num line:4 type:5
= line:4 type:25
10 line:4 type:2

可以看到，在a.ini中寫入include的部分，是b.ini檔案內容解析後的詞素。並且on和off都被正常解析出來了。且字串也被正常處理出來了。

Melon的Github倉庫為：https://github.com/Water-Melon/Melon

感謝閱讀

C語言第三方庫Melon開箱即用之詞法分析器使用

技術標籤：開發後端框架c語言c++後端linux雲端計算之前的文章中，筆者介紹了Linux/UNIX C語言庫Melon的基本功能及框架使用。

用c++語言socket庫函式實現服務端客戶端聊天室

客戶端 /* * 程式名：client.cpp，此程式用於演示socket的客戶端 * 作者：C語言技術網(www.freecplus.net) 日期：20190525

C語言stdlib庫中的malloc和realloc

#include<stdio.h> #include<stdlib.h> #include<string.h> //void *malloc(size_t size) //分配所需的記憶體空間，並返回一個指向它的指標。若失敗，則返回NULL

【演算法】【字串】C語言常用庫函式實現

strcpy #include <iostream> #include <assert.h> using namespace std; char * my_strcpy(char* str1,const char* str2)

C語言題庫-----迴圈輸出-------菱形列印

C語言題庫——迴圈——菱形列印原題： ****思考1：本題有較強的規律性，並且——（第一行-倒數第一行）（第二行——倒數第二行）（第三行——倒數第三行）都有著一樣的排列思考二：從第一行出發，會發現從

PhpStorm 2020.3：新增開箱即用的PHP 8屬性(推薦)

PhpStorm是一個輕量級且便捷的PHP IDE，其旨在提高使用者效率，可深刻理解使用者的編碼，提供智慧程式碼補全，快速導航以及即時錯誤檢查。可隨時幫助使用者對其編碼進行調整，執行單元測試或者提供視覺化debug功能。

純前端完成批量下載檔案功能，可以下載任何檔案，開箱即用

最近工作中遇到了一個批量下載檔案的需求，要求在前端實現，本來打算在網上找一下CV完事。但是找一圈下來沒有一個合適的，不是隻支援下載圖片，就是寫的過於簡略。無奈，只能自己搞！自己動手，豐衣足食，本著我為人

vue-automation 是一款開箱即用的 Vue 專案模版，它基於 Vue CLI 4

特點預設整合 vue-router 、vuex 和 axios 全域性 SCSS 資源自動引入全域性元件自動註冊

C語言單元測試（UT）用例編寫——gtest+stub打樁

技術標籤：windows工具使用測試開發 stub工具原始碼：https://github.com/coolxv/cpp-stub/tree/master/src

實現C語言一些庫函式

技術標籤：c語言程式語言 1、關於strlen //strlen()庫函式的範圍型別是size_t //size_t == unsigned int

C語言題庫（持續更新）

技術標籤：c語言 C語言題庫（持續更新）可能我寫的很麻煩，這是因為我想在敲程式碼的時候學習英語詞彙，望勿吐槽~~~

C語言高效位運算的妙用

技術標籤：c++演算法高效位運算的妙用文章目錄高效位運算的妙用引言位運算子二進位制補碼運算公式應用乘法求餘數判斷奇偶性相反數求整數的絕對值交換整數判斷一個數是否是2的冪求平均數掩碼集合的表示

開箱即用的微服務框架 Go-zero（進階篇）

之前我們簡單介紹過 Go-zero 詳見《Go-zero：開箱即用的微服務框架》。這次我們從動手實現一個 Blog 專案的使用者模組出發，詳細講述 Go-zero 的使用。

從0到1用react+antd+redux搭建一個開箱即用的企業級管理後臺系列（基礎篇）

背景最近因為要做一個新的管理後臺專案，新公司大部分是用vue寫的，技術棧這塊也是想切到react上面來，所以，這次從0到1重新搭建一個react專案架子，需要考慮的東西的很多，包括目錄結構、程式碼規範、請求封裝等

linux c++呼叫第三方庫so 小記

1.undefined reference to `dlopen\'1.標頭檔案新增：#include <dlfcn.h>2.編譯選項里加 -ldl即： g++ main.cpp -o main -ldl或者gccclion 下新增TARGET_LINK_LIBRARIES(outdoorRobot dl)

打造之Zap 開箱即用日誌元件，優點非常明顯

logrus 是 golang 一款非常優秀的日誌框架, 優雅的程式碼框架設計, 可以作為我們設計元件的參考. 具體請參見我前面文章(連結文末給出)

Element Vue 開箱即用框架如何使用-測試開發【提測平臺】階段小結(二)

微信搜尋【大奇測試開】，關注這個堅持分享測試開發乾貨的傢伙。上一篇總結了後端服務介面的開發，這篇我們主要來總結下前後端分離開發中的前端部分，主要是開箱即用的框架介紹和之前章節元件的梳理和部分的擴充套

vue timeline 開箱即用的時間軸元件，日誌更新時間軸元件

年月展示時間軸元件 <template> <div> <Timeline :title=\"title\" :data-list=\"dataList\"

問題解決：補充安裝c語言的庫函式和系統呼叫man手冊

問題解決：補充安裝c語言的庫函式和系統呼叫man手冊今日份麻麻~上課時大家的Ubuntu都可以通過man查到關於stat的庫函式，但是我的Kali查出來是這樣：

Mock平臺3-初識Antd React 開箱即用中臺前端框架

微信搜尋【大奇測試開】，關注這個堅持分享測試開發乾貨的傢伙。內容提要

C語言第三方庫Melon開箱即用之詞法分析器使用

基礎使用

進階使用

a.ini

b.ini

相關推薦