跟廠長學PHP核心7(六):變數之zval
記得網上流傳甚廣的段子“PHP是世界上最好的語言”,暫且不去討論是否言過其實,但至少PHP確實有獨特優勢的,比如它的弱型別,即只需要$符號即可宣告變數,使得PHP入手門檻極低,成為大家所青睞的Web服務端語言。那麼它的變數是如何實現的呢?我們今天就來學習一下PHP的基本變數。
一、引言
PHP的變數儲存在zval結構體中,在執行階段中編譯為op_array時就能看到zval的身影。結構體定義在Zend/zend_types.h
中,定義內容如下所示:
struct _zval_struct { zend_value value; /* value */ union { struct { ZEND_ENDIAN_LOHI_4( zend_uchar type, /* active type */ zend_uchar type_flags, zend_uchar const_flags, zend_uchar reserved) /* 保留欄位 */ } v; uint32_t type_info; } u1; union { uint32_t var_flags; uint32_t next; /* hash collision chain */ uint32_t cache_slot; /* literal cache slot */ uint32_t lineno; /* line number (for ast nodes) */ uint32_t num_args; /* arguments number for EX(This) */ uint32_t fe_pos; /* foreach position */ uint32_t fe_iter_idx; /* foreach iterator index */ } u2; };
二、結構體剖析
2.1、zend_value
結構體的第一個變數是zend_value,顧名思義,它其實也是一個結構體,用於存放變數的值,比如整型、浮點型、引用計數、字串、陣列、物件、資源等。zend_value
定義了眾多型別的指標,但這些型別並不都是變數的型別,有些是給核心自己使用的,比如指標ast、zv、ptr。
typedef union _zend_value { zend_long lval; /* 整型 */ double dval; /* 浮點型 */ zend_refcounted *counted; /* 引用計數 */ zend_string *str; /* 字串 */ zend_array *arr; /* 陣列 */ zend_object *obj; /* 物件 */ zend_resource *res; /* 資源 */ zend_reference *ref; /* 引用 */ zend_ast_ref *ast; /* 抽象語法樹 */ zval *zv; /* zval型別 */ void *ptr; /* 指標型別 */ zend_class_entry *ce; /* class型別 */ zend_function *func; /* function型別 */ struct { uint32_t w1; uint32_t w2; } ww; } zend_value;
2.2、u1
u1是一個聯合體,它聯合了結構體v
和整型type_info
。下面我們先來看一下結構體v
的構成。
union { struct { ZEND_ENDIAN_LOHI_4( zend_uchar type, /* active type */ zend_uchar type_flags, zend_uchar const_flags, zend_uchar reserved) /* call info for EX(This) */ } v; uint32_t type_info; } u1;
2.2.1、type
type是指變數的型別,剛在2.1
中講到了zend_value是用來儲存變數的值,所以也應該有地方儲存變數的型別,而這就是type的職責。以下是PHP定義的所有變數型別,有我們熟知的布林、NULL、浮點、陣列、字串等型別。也有陌生的undef、indirect、ptr型別,變數型別在下一章中詳解,這裡不再贅述。
/* regular data types */
#define IS_UNDEF 0
#define IS_NULL 1
#define IS_FALSE 2
#define IS_TRUE 3
#define IS_LONG 4
#define IS_DOUBLE 5
#define IS_STRING 6
#define IS_ARRAY 7
#define IS_OBJECT 8
#define IS_RESOURCE 9
#define IS_REFERENCE 10
/* constant expressions */
#define IS_CONSTANT 11
#define IS_CONSTANT_AST 12
/* fake types */
#define _IS_BOOL 13
#define IS_CALLABLE 14
/* internal types */
#define IS_INDIRECT 15
#define IS_PTR 17
2.2.2、type_flags
可以把它理解為子型別,上面提到了變數的型別,這個是針對不同型別的子型別或標記,type_flags
一共有以下6種。
/* zval.u1.v.type_flags */
#define IS_TYPE_CONSTANT (1<<0) /* 常量 */
#define IS_TYPE_IMMUTABLE (1<<1) /* 不可變的型別 */
#define IS_TYPE_REFCOUNTED (1<<2) /* 需要引用計數的型別 */
#define IS_TYPE_COLLECTABLE (1<<3) /* 可能包含迴圈引用的型別 */
#define IS_TYPE_COPYABLE (1<<4) /* 可被複制的型別 */
#define IS_TYPE_SYMBOLTABLE (1<<5) /* 符號表型別 */
2.2.3、const_flags
常量型別的標記,對應的屬性為:
/* zval.u1.v.const_flags */
#define IS_CONSTANT_UNQUALIFIED 0x010
#define IS_LEXICAL_VAR 0x020
#define IS_LEXICAL_REF 0x040
#define IS_CONSTANT_CLASS 0x080 /* __CLASS__ in trait */
#define IS_CONSTANT_IN_NAMESPACE 0x100 /* used only in opline->extended_value */
2.2.4、type_info
type_info與結構體v共用記憶體,修改type_info等同於修改結構體v的值,所以type_info是v中四個char的組合。
2.3、u2
本來使用u1和zend_value就可以表示變數的,沒有必要定義u2,但是我們來看一下,如果沒有u2,在記憶體對齊的情況下zval記憶體大小為16個位元組,當聯合了u2後依然是佔用16個位元組。既然有或沒有佔用記憶體大小相同,不如用它來記錄一些附屬資訊。下面我們來看下u2都儲存了哪些內容。
2.3.1、next
用來解決雜湊衝突問題,記錄衝突的下一個元素位置。
2.3.2、cache_slot
執行時快取,在執行函式時回去快取中查詢,若快取中沒有則到全域性function表中查詢。
2.3.3、lineno
檔案執行的行號,應用在AST節點上。Zend引擎在詞法和語法解析時會把當前執行的檔案行號記錄下來,記錄在zend_ast中的lineno中。
2.3.4、num_args
函式呼叫時傳入函式的引數個數。
2.3.5、fe_pos
用於遍歷陣列時記錄當前遍歷的位置,比如每次執行foreach時fe_pos都會加一,當再次呼叫foreach進行遍歷時,fe_post會進行重置。
2.3.6、fe_iter_idx
這個與fe_pos類似,只不過它是針對物件的。物件的屬性也是HashTable,傳入的引數是物件時,會獲取物件的屬性,所以遍歷物件就是在變數物件的屬性。
三、參考文獻
- 《PHP7核心剖析》
- 《PHP7底層設計和原始碼實現》