模板引擎：二、實現一個Json解析器

阿新 • • 發佈：2019-01-22

2.Js實現Json解析器

前言

本文主要對Json解析器的實現進行探討。
如果想深入瞭解其原理，可以參考上一篇文章：模板引擎：一、理解Json解析器工作原理

案例說明

例如：拿一段最簡單的Json字串舉例(“{ “a”: 1 }”)，要將其解析為JSON物件。

我們先將其進行拆分取出字串中的特徵值(Token),我們可以得到下面七個Token:

    // 以逗號','進行分割
    ", {, "a", :, 1, }, "

然後，通過我們之前定義的資料結構進行匹配：

{}，以一對大括號包裹的定義為一個物件，並且物件結構是以key-value形式進行儲存

“”, 以一對雙引號包裹的定義為字串
1, 定義為數值型別

這樣，我們就識別出了我們想要的資料結構

{
    "a": 1
}

思路

通過上面的舉例，對Json解析器應該有了基本的理解。
但是，羅馬不是一天建成的。接下來我們將逐步完善Json解析器

識別關鍵字

下面再通過一段程式碼進行說明,先實現一個簡單的關鍵字解析器


// 定義關鍵字(Token)
const ENUM = {
    _TRUE: true,
    _FALSE: false,
    _NULL: null,
    _UNDEFINED: undefined
}

let at = 0 
 // 當前字元所在的下標
let ch = '' // 當前字元

let text = '' // 定義一個字串物件

/** 
 * 定義一個字元掃描器 
 * params: char 傳入的為當前掃描的欄位
 * return: 返回當前掃描(at)的一個字元(ch)
 **/
const getCharAt = (char) => {

    if(char && char !== ch) {
        console.error(`當前字元讀取錯誤: ${ch}，錯誤位置: ${at}`)
        return
    }
    ch = text.charAt(at) // 讀取當前字元 

    at++ // 指標後移一位
    return ch
}


/**
 * 關鍵字掃描器
 * 功能描述：
 *   可識別字段（true,false,null,undefined）
 **/
const keyword = () => {
    // 通過首字母進行識別
    switch(ch) {
        case 't':
            getCharAt('t')
            getCharAt('u')
            getCharAt('r')
            getCharAt('e')
            return ENUM._TRUE
        case 'f':
            getCharAt('f')
            getCharAt('a')
            getCharAt('l')
            getCharAt('s')
            getCharAt('e')
           return ENUM._FALSE
        case 'n':
            getCharAt('n')
            getCharAt('u')
            getCharAt('l')
            getCharAt('l')
           return ENUM._NULL
        case 'u':
            getCharAt('u')
            getCharAt('n')
            getCharAt('d')
            getCharAt('e')
            getCharAt('f')
            getCharAt('i')
            getCharAt('n')
            getCharAt('e')
            getCharAt('d')
           return ENUM._UNDEFINED
    }
}


/** 
 * 源字串
 * 測試用例： 'true','false','null','undefined'  
 **/
text = 'null'
// 呼叫關鍵字解析器
keyword() // 輸出: null

通過上面的關鍵字解析器，我們可以從源字串中識別出基本的幾個關鍵字
但是，這個解析器有一個缺陷，它只能精確識別諸如'false'、'null'等無空格的字串

如果字串中包含有多個空格（’ null’, ‘ false’），那麼我們的解析器就會失效了。

那麼，解決的思路有兩種

第一種，通過正則匹配，將字串中的空格進行過濾(str.replace(reg,''))
特點：高效實用
另一種，實現過濾函式，如果當前字元是空格的話，跳過該字元，指標後移一位(at++)
特點：容易理解

我們通過第二種方式進行講解

// 接上面的程式碼
...

// 定義一個過濾函式
const filter = () => {
  while(ch & ch === ' ') {
    getCharAt()  // 如果當前字元為空格，指標後移一位 at++ 
  }
}


/** 
 * 源字串
 * 測試用例： '   true','   false','  null','  undefined'  
 **/
text = '   null'
// 呼叫過濾函式
filter()
// 呼叫關鍵字解析器
keyword() // 輸出: null

看到這裡，一個簡單的關鍵字解析器已經完成了。是不是有點小激動呢，哈哈，下面我們將慢慢考慮識別更多的資料結構了。

識別數值型別

數值型別的定義：

正數
- 整型
- 浮點型
- 指數型
負數
- 同上

考慮到篇幅有限，我們暫且只處理整型和浮點型的數值。

/**
 * 數值型別判斷
 * 
 **/
const number = () => {
    let str
    // 識別整型 
    while(ch && ch >= '0' && ch <= '9') {
        str += ch
        next()
    }
    // 識別浮點型
    if(ch === '.') {
        str += '.'
        next('.')
        while(next() && ch >= '0' && ch <= '9') {
            str += ch   
        }
    }
    return +str // 轉換為數值型

}



/** 
 * 源字串
 * 測試用例： '   1','   1.2','  12.34','1234'  
 **/
text = '  1.2'
// 呼叫過濾函式
filter()
// 呼叫數值解析器
number() // 輸出: 1.2

我們已經可以識別基本的數字型別了。

不過，下面有種情況，他們也屬於數值型別，但是解析器無法識別

+1
+1.2
-1
-1.2

不難看出，我們少了數值符號的判斷邏輯。因此，我們新增下面的符號條件判斷

/**
 * 數值符號
 * return 呼叫匹配的數值型別，並將符號傳入
 **/
const symbol = () => {
    if(ch === '+' || ch === '-') {
        let sym = ch // 識別以'+'、'-'起始的字元
        next(ch) // 指標後移
        if(ch && ch >= '0' && ch <= '9' ) {
            return number(sym) // 進入數值型別判斷
        }
    }
}

然後我們再重構我們的number函式

const number = (sym = '') => {
    // 邏輯不變
    ...
    return sym + (+str)

}

通過修改，我們又可以匹配諸如下面幾種有符號的數值型別了。

+1
+1.2
-1
-1.2

不過，number函式還是有一個Bug。

如果，輸入 1.2abc 或者1a2b 這類不合法的數值型別，我們必須對這種情況進行異常處理。

繼續重構我們的number函式

const number = () => {
    // 同上
    ...
    // return str + (+val)
    if(!isFinite(val)) {
        console.error(`無效的數值型別:${val}`)
    } else {
        return str + (+val)
    }

}

這樣，我們的Number函式就比較完善了。

識別字符串型別

字串定義，以一對”“包含的型別。

/**
 *  字串型別定義
 *  return 返回一個字串
 **/

 const string = () => {
    let str
    // " 起始
    if(ch === '"') {
        // 過濾空格
        filter()
        next('"')
        while(next()) {
            // “ 結尾
            if(ch === '"') {
                next('"')
                return str
            } else {            
                str += ch
            }
        }
    }
    console.error(`無效字串：${str},位置：${at}`)

/** 
 * 源字串
 * 測試用例： '"1"','"1a"','"   key"','"  1a."'  
 **/
text = '"   key"'
// 呼叫過濾函式
filter()
// 呼叫數值解析器
string() // 輸出: "key"
}

好了，到這裡基本資料型別講解完畢。我們將這三種資料型別整合到一個函式(getValue)中


const getValue = () => {
    filter()
    switch(ch) {
        case '"':
            return string()
        case '+':
        case '-':
            return symbol()
        case '[':
            return array()
        case '{':
            return object()
        default:
            return (ch && ch >='0' && ch <='9') ? number() : keyword()

    }

}

然後我們開始難度升級，對複合型別的處理(物件、陣列)

識別陣列

定義：以一對[]包裹，並以‘,’進行分割的資料型別。


const array = () => {
    let arr = []
    // 以 [ 起始
    if(ch && ch === '[') {
        next('[')
        filter() // 過濾空格
        // 識別為空陣列
        if(ch && ch === ']') {
            return arr
        }
        while(next()) {
            // 遞迴
            arr.push(getValue())
            if(ch === ']') {
                return arr
            }
            filter()
            // 以 , 將值進行分割
            if(ch === ',') {
                next(',')
            }
        }
    }
}

陣列匹配的難度在於遞迴的思想，去遍歷陣列中的各種資料型別。這也是處理複合型別的統一方法。

識別物件

與陣列的判斷方式型別,關鍵區別在於物件的資料格式是以”key-value形式儲存”。
而key則必須為一個基本資料型別，本文暫定為字串型別。

const object = () => {
    let obj = {}

    if(ch && ch === '{') {
        next('{')
        filter()
        //  空物件
        if(ch && ch === '}') {
            return obj
        }
        while(next()) {
            // 物件的key,型別為字串
            let key = string()
            filter()
            if(ch && ch === ':') {
                next(':')
                if(Object.hasOwnProperty.call(obj,key)) {
                    console.error(`物件關鍵字重複：${key}`)
                }
                // 遞迴獲取物件的value
                obj[key] = value()
                filter()
                if(ch && ch ==='}') {
                    next('}')
                    return obj
                }
                // 以 , 將key-value進行分割
                if(ch && ch === ',') {
                    next(',')
                }
            }
        }
    }

}

這樣，我們的基本Json物件就介紹完畢。

待改進部分

我們這個解析器對數值型別的判斷還是不夠準確。例如：2e10指數型別沒有正確識別。
以及，\t\n 轉義字元也未作處理。如果有興趣，可以繼續深入研究下去。謝謝！

可以參考下面的原始碼進行對比學習

這裡寫圖片描述

模板引擎：二、實現一個Json解析器

2.Js實現Json解析器前言本文主要對Json解析器的實現進行探討。如果想深入瞭解其原理，可以參考上一篇文章：模板引擎：一、理解Json解析器工作原理案例說明例如：拿一段最簡單的Json字串舉例(“{ “a”: 1

從零開始打造一個新聞訂閱APP之爬蟲篇（二、實現一個簡單的爬蟲系統）

前景提要：如何開發一個新聞訂閱APP之爬蟲篇（一、背景介紹&需求分析）做一個特定的爬蟲系統，首先考慮它要做什麼？從網際網路上抓取指定的N個站點資訊，解析提取需要的內容，按照特定的結構儲存；系統結構圖如下：下面是主要的程式碼結構；

如何編寫一個JSON解析器

編寫一個JSON解析器實際上就是一個函式，它的輸入是一個表示JSON的字串，輸出是結構化的對應到語言本身的資料結構。和XML相比，JSON本身結構非常簡單，並且僅有幾種資料型別，以Java為例，對應的資料結構是： "string"：Java的 String ；number：Java的 Long 或 D

二維繪圖引擎：圓、半圓、弧線繪制

mat draw code del data- lineto ani tro ram 二維畫圖引擎-畫圓、半圓、弧線 // // QHCircle.m // 繪圖 // #import "QHCircle.h" @implement

python作業/練習/實戰：3、實現商品管理的一個程序

pan utf python文件學習筆記要求 span 定義 add utf-8 作業要求實現一個商品管理的一個程序，運行程序有三個選項，輸入1添加商品；輸入2刪除商品；輸入3 查看商品信息1、添加商品：商品名稱：xx 商品如果已經存在，提示商品已存在

Producer-Consumer模型：二、如何實現

Producer-Consumer模型的實現主要考慮一下幾個方便：生成者的實現消費者的實現訊息佇列執行緒的通訊、等待、同步執行緒的終止 1.Producer 生產者負責把請求加入佇列，如果佇列已滿則等待或者返回錯誤。 pub

二、第一個java程式：HelloWorld

} 儲存文字檔案到D:\JavaStudy，檔名為“HelloWorld”，關閉檔案，修改“HelloWorld”副檔名為“.java”，此時檔案的全名就是“HelloWorld.java”，如果看不到副檔名，則開啟“我的電腦”，選擇“工具→資料夾選項”選單（如果你看不到“資料夾選項”，說明你的電

一步一步學java：二、使用idea15建立第一個springboot架構的後臺介面程式

1.建立專案 2.建立一個名為HelloWorld的controller 3.配置程式 4.點選生成，執行，使用postman測試成功 5.打包（springboot一般都是打包成jar包，這裡打包成jar包，怎麼打包成war包，後面再

設計模式：自己手動實現一個觀察者設計模式

package rgs name gree 觀察者設計模式 forecast server 它的 upd 觀察者模式: 定義了對象之間的一對多依賴，這樣一來。當一個對象(被觀察者)改變狀態時，它的全部依賴者(觀察者)都會收到通知並自己主動更新。在觀察者模式中，會

聊聊高並發（三十二）實現一個基於鏈表的無鎖Set集合

target 方向刪除元素 min 集合 date 變量 find Set表示一種沒有反復元素的集合類，在JDK裏面有HashSet的實現，底層是基於HashMap來實現的。這裏實現一個簡化版本號的Set，有下面約束： 1. 基於鏈表實現。鏈表節點依照對象的h

ASP.Net WebForm溫故知新學習筆記：二、ViewState與UpdatePanel探秘

ole htable nbsp 工具 utf cti abi divide 優點原文地址：http://www.cnblogs.com/edisonchou/p/3901559.html 開篇：經歷了上一篇《aspx與服務器控件探秘》後，我們了解了aspx和服務器控件

傳智：自己簡單實現一個struts2框架的demo

throws for request 運行本地化 color ray run main struts2的結構圖：代碼實現：組織結構：主要代碼： package cn.itcast.config; import org.apache.log4j.Logg

一、實現一個特殊的棧，在實現棧的基本功能的基礎上，再實現返回棧中最小元素的操作

empty util run print pri ont com res 字符串請指教交流！ 1 package com.it.hxs.c01; 2 3 import java.util.Stack; 4 5 /* 6 實現一個特殊的棧，在實現棧的基本

自己動手實現一個簡單的JSON解析器

pair bool 優點輕量結束 pan isdigit 復雜 false 1. 背景 JSON(JavaScript Object Notation) 是一種輕量級的數據交換格式。相對於另一種數據交換格式 XML，JSON 有著諸多優點。比如易讀性更好，占用空間更少等

AWS考證方向：二、實例綁定彈性IP

分享實例 bdc 私有 watermark bce 用戶 xshel 51cto AWS主機綁定彈性IP 1.在主機頁面找《彈性IP》： 2.找到《彈性IP》之後，然後再點擊《分配新地址》（如果第一次綁定彈性IP不用勾選已經綁定彈性IP的主機） 3.點擊分配之後，就會出現

AWS考證方向：六、實現WEB負載均衡

god col ssh key .org c2c tps 系統類型 acf 分鐘 AWS上實現WEB負載均衡 1、創建實例 2、選擇系統類型和版本 3、選擇實例的類型規格，選擇完點擊下一步 4、配置實例的詳細信息，實現負載均衡要兩臺主機及以上 5、添加存儲，一般每臺主機的根

OpenStack Pike Minimal安裝：二、身份認證

type http sys ont show pass tro install lock 1.在controller節點上安裝keystone root@controller ~]# yum install openstack-keystone httpd mod_wsgi

第5章：介面、實現和多型

介面介面是軟體資源使用者可用的一組操作介面中的內容是函式頭和方法頭，以及它們的文件設計良好的軟體系統會將介面與其實現分隔開來多型多型是在兩個或

Spring Developer Tools 源碼分析：二、類路徑監控

ring hfile 其中 fadd folder 添加 star adbd 監控目錄在 Spring Developer Tools 源碼分析一中介紹了 devtools 提供的文件監控實現，在第二部分中，我們將會使用第一部分提供的目錄監控功能，實現對開發環境中 cla

AJAX：二、XMLHttpRequest實踐

XHR(XMLHttpRequest) 實踐簡介 XMLHttpRequest(通常縮寫XHR) 是一個 API，它為客戶端提供了在客戶端和伺服器之間傳輸資料的功能。它提供了一個通過 URL 來獲取資料的簡單方式，並且不會使整個頁面重新整理。這使得網頁只更新一部分頁面而

模板引擎：二、實現一個Json解析器

2.Js實現Json解析器

前言

案例說明

思路

識別關鍵字

識別數值型別

識別字符串型別

識別陣列

識別物件

待改進部分

相關推薦