1. 程式人生 > >lua API 小記——— lua虛擬機器初始化)

lua API 小記——— lua虛擬機器初始化)

1. 建立lua虛擬機器

lua_State *lua_newstate (lua_Alloc f, void *ud)

建立一個新的獨立的lua虛擬機器. 引數指定了記憶體分配策略及其引數, 注意, 讓使用者可以定製記憶體分配策略是十分有用的, 比如在遊戲伺服器端使用lua, 我做過一次統記lua在執行的時候會大量的分配大小小於128位元組的記憶體塊, 在這樣的環境下, 使用lua原生的分配器就不太適合了, 還好在伺服器端, 我們往往已經實現了memory pool, 這時只需要寫一個符合 lua_Alloc 原型的介面卡, 然後指定為lua的記憶體分配器就可以了, 很靈活.

從lua的設計層面來說, lua只是記憶體分配器的使用者, 它只使用一個簡單的介面來分配記憶體, 而不去實現如何分配, 畢竟記憶體分配不在lua的功能範圍內, 這樣使的lua變的更加緊湊, 它只是專注於實現lua本身, 而不需要去關注記憶體分配策略這樣的和lua本身無關的東西. 其實學習lua原始碼不光是為了更好的掌握lua, 也是為了學習lua中的體現出來的一些程式設計思想, lua是一個高度的一致性的, 優雅的軟體作品

失敗返回null, 多是因為記憶體分配失敗了

該函式會建立棧

從該函式學習到的東西:  1. 當你製作一個功能時, 最好是理清該功能的核心概念和需求, 然後去實現他們, 功能要模組化, 核心概念之間應該是概念一致的, 聯絡緊密的[談何容易, 只能是儘可能的, 隨時提醒自己要有這樣的想法].

                                2. 不要因為功能的實現問題而將一個非該功能核心概念的東西加進來, 反之應該把這些東西抽象化作為使用者可配置的形式.[在實現時很容易發生"要用到某個功能了, 就是實現它"這樣的情況, 這樣並不好]就比如lua, 它的核心概念就是lua虛擬機器, 而記憶體分配只是在實現lua虛擬機器的過程中的要用到的一種東西, 但它本身不在lua的核心概念裡面, 所以把它暴露出來, 讓使用者自己去定製.

                                再說下去就是: 除了系統最核心的功能, 其他的東西能用外掛的形式暴露給使用者, 使其可配置可擴充套件.

關於這個函式, 還要做更多的解釋, 比如我們看到的lua的絕大多數api的第一個引數都是lua_State* L, 而這個L就是lua_newstate製造出來的, 那麼在分析原始碼的時候, 當然要去看看lua_newstate到底是幹了些什麼, lua_State的結構又是什麼, 要了解這些內容, 需要知道lua的內部組織結構, 下面是一張很概括但能反映其結構的圖

JSZUY$VR25$M{O}OQV59XYW

可以看出來, 在一個獨立的lua虛擬機器裡, global_State是一個全域性的結構, 而lua_State可以有多個

值得說明的是, 當呼叫lua_newstate的時候, 主要的工作就是1. 建立和初始化global_State 2. 建立一個lua_State, 下面來詳細的講解global_State的內容和作用.

global_State

一個lua虛擬機器中只有一個, 它管理著lua中全域性唯一的資訊, 主要是以下功能

1. 記憶體分配策略及其引數, 在呼叫lua_newstate的時候配置它們. 也可以通過lua_getallocf和lua_setallocf隨時獲取和修改它

2. 字串的hashtable, lua中所有的字串都會在該hashtable中註冊.

3. gc相關的資訊. 記憶體使用統計量.

4. panic, 當無保護呼叫發生時, 會呼叫該函式, 預設是null, 可以通過lua_atpanic配置.

5. 登錄檔, 注意, 登錄檔是一個全域性唯一的table.

6. 記錄lua中元方法名稱 和 基本型別的元表[注意, lua中table和userdata每個例項可以擁有自己的獨特的元表--記錄在table和userdata的mt欄位, 其他型別是每個型別共享一個元表--就是記錄在這裡].

7. upvalue連結串列.

8. 主lua_State, 一個lua虛擬機器中, 可以有多個lua_State, lua_newstate會創建出一個lua_State, 並邦定到global_state的主lua_State上.

global_State主要是管理lua虛擬機器的全域性環境.

lua_State

1. 要注意的是, 和nil, string, table一樣, lua_State也是lua中的一種基本型別, lua中的表示是TValue {value = lua_State, tt = LUA_TTHREAD}

2. lua_State的成員和功能

    a. 棧的管理, 包括管理整個棧和當前函式使用的棧的情況.

    b. CallInfo的管理, 包括管理整個CallInfo陣列和當前函式的CallInfo.

    c. hook相關的, 包括hookmask, hookcount, hook函式等.

    d. 全域性表l_gt, 注意這個變數的命名, 很好的表現了它其實只是在本lua_State範圍內是全域性唯一的的, 和登錄檔不同, 登錄檔是lua虛擬機器範圍內是全域性唯一的.

     e. gc的一些管理和當前棧中upvalue的管理.

     f. 錯誤處理的支援.

3. 從lua_State的成員可以看出來, lua_State最主要的功能就是函式呼叫以及和c的通訊.

lua_State主要是管理一個lua虛擬機器的執行環境, 一個lua虛擬機器可以有多個執行環境.

lua_newstate函式的流程

經過上面的分析, 可以看出newstate = [new 一個 global_state] + [new 一個 lua_State], 現在看一下它的流程, 很簡單

1. 新建一個global_state和一個lua_State.

2. 初始化, 包括給g_s建立登錄檔, g_s中各個型別的元表的預設值全部置為0.

3. 給l_s建立全域性表, 預分配l_s的CallInfo和stack空間.

4. 其中涉及到了記憶體分配統統使用lua_newstate傳進來的記憶體分配器分配.

2. 建立新lua執行環境

lua_State *luaE_newthread (lua_State *L)

建立一個新的lua_State, 預分配CallInfo和stack空間, 並共享l_gt表, 注意, 雖然每個lua_State都有自己的l_gt, 但是這裡是卻將新建的lua_State的l_gt都指向主lua_State的l_gt.

注意, lua_State是lua執行的基礎[CallInfo]和與c通訊的基礎[stack], 在新的lua_State上操作不會影響到原來的lua_State:), 這個是協程實現的基礎. 這裡順便提一下協程, 這裡先引一段lua創始人的話:" 我們不信任基於搶佔式記憶體共享的多執行緒技術. 在 HOPL 論文中, 我們寫道: "我們仍然認為, 如果在連 a=a+1 都沒有確定結果的語言中, 無人可以寫出正確的程式." 我們可以通過去掉搶佔式這一點, 或是不共享記憶體, 就可以迴避這個問題."協程的基礎就是"去掉搶佔式, 但共享記憶體", 這裡的共享是在lua虛擬機器的層面上的, 而不是通常意義上的share memory, 這裡的共享記憶體直接就指的是不同執行緒[lua_State]之間, 共享lua_State.l_gt全域性表, 全域性表可以作為不同協程之間的通訊環境, 當然也可以用lua_xmove函式, 協程的事先說到這裡.

一個和多lua_State相關的函式是: 在同一個lua虛擬機器裡傳遞不同lua_State的值

void lua_xmove (lua_State *from, lua_State *to, int n)
把from棧上的前n個值彈出, 並壓入到to棧中.