1. 程式人生 > >使用有限狀態機(FSM)解釋shell 命令

使用有限狀態機(FSM)解釋shell 命令

一、有限狀態機(Finite State Machine,FSM)是表示有限個狀態及在這些狀態之間的轉移和動作等行為的數學模型,在計算機領域有著廣泛的應用。FSM一個常見的應用就是用來負責Parser複雜的資料結構,比如解釋URI協議(uri-rfc239、uri-rfc3986)(註釋:統一資源識別符號(Uniform Resource Identifier,或URI)),在這裡以Linux下shell命令字串解釋為列子,說明FSM的應用。

二、簡單介紹shell中的各種符號應用
1、shell指令碼中的單引號和雙引號一樣都是字串的界定符,而不是字元的界定符。單引號用於保持引號內所有字元的字面值,即使引號內的\和回車也不例外,但是字串中不能出現單引號。(注意是所有,只是單引號本身不能夠出現在其中)。

2、雙引號用於保持引號內所有字元的字面值(回車也不例外),但以下情況除外:
escape$的字面值
`表示`的字面值
\”表示”的字面值
\表示\的字面值
除以上情況之外,在其它字元前面的\無特殊含義,只表示字面值。

雙引號還有一個作用,引用的字串包含空格的時候,可以用雙引號括起來。

3、環境變數,使用()USER, HOME使{USER},${HOME}形式引用環境變數。

三、基於以上認識,設計了下面的狀態圖,系統初始狀態是TEXT狀態,其中ESC是ESCAPE,表示轉義字元狀態,舉個列子,提供shell字串cmdline,逐個每個輸入的字元,如果遇到輸入進來的字元是 \ 表示進入ESC狀態,在ESC狀態輸入任何字元立即進入TEXT狀態。在看,TEXT狀態,如果輸入的字元是$,系統進入VAR環境變數狀態,再接下來如果是 { 字元, 系統進入 VARNAME2 狀態,否則進入 VARNAME狀態。待系統遍歷完所有的cmdline上的字元,就完成了shell 命令的解釋(parser)工作。

這裡寫圖片描述

四、上程式碼

這裡寫程式碼片