深入理解 PHP7 中全新的 zval 容器和引用計數機制
深入理解 PHP7 中全新的 zval 容器和引用計數機制
最近在查閱 PHP7 垃圾回收的資料的時候,網上的一些代碼示例在本地環境下運行時出現了不同的結果,使我一度非常迷惑。 仔細一想不難發現問題所在:這些文章大多是 PHP5.x 時代的,而 PHP7 發布後,采用了新的 zval 結構,相關的資料也比較貧瘠,所以我結合一些資料做了一個總結, 主要側重於解釋新 zval 容器中的引用計數機制 ,如有謬誤,還望不吝指教。
PHP7 中新的 zval 結構
明人不說暗話,先看代碼!
- struct _zval_struct{
- union {
- zend_long lval; /* long value */
- double dval; /* double value */
- zend_refcounted *counted;
- zend_string *str;
- zend_array *arr;
- zend_object *obj;
- zend_resource *res;
- zend_reference*ref;
- zend_ast_ref *ast;
- zval *zv;
- void *ptr;
- zend_class_entry *ce;
- zend_function *func;
- struct {
- uint32_t w1;
- uint32_t w2;
- } ww;
- } value;
- union {
- struct {
- ZEND_ENDIAN_LOHI_4(
- zend_uchar type, /* active type */
- zend_uchar type_flags,
- zend_uchar const_flags,
- zend_uchar reserved) /* call info for EX(This) */
- } v;
- uint32_t type_info;
- } u1;
- union {
- uint32_t var_flags;
- uint32_t next; /* hash collision chain */
- uint32_t cache_slot; /* literal cache slot */
- uint32_t lineno; /* line number (for ast nodes) */
- uint32_t num_args; /* arguments number for EX(This) */
- uint32_t fe_pos; /* foreach position */
- uint32_t fe_iter_idx; /* foreach iterator index */
- } u2;
- };
對於該結構的詳細描述可以參考文末鳥哥的文章,寫的非常詳細,我就不關公面前耍大刀了,這裏我只提出幾個比較關鍵的點:
- PHP7 中的變量分為 變量名 和 變量值 兩部分,分別對應 zval_struct和在其中聲明的 value
- zval_struct.value中的 zend_long 、 double 都是 簡單數據類型 ,能夠直接儲存具體的值,而其他復雜數據類型儲存一個指向其他數據結構的 指針
- PHP7 中,引用計數器儲存在 value 中而不是 zval_struct
- NULL 、 布爾型 都屬於 沒有值 的數據類型(其中布爾型通過 IS_FALSE 和 IS_TRUE 兩個常量來標記),自然也就沒有引用計數
- 引用 (REFERENCE)變為了一種數據結構而不再只是一個標記位了,它的結構如下:
- struct _zend_reference{
- zend_refcounted_h gc;
- zval val;
- }
6.
zend_reference
作為 zval_struct
中包含的一種 value 類型,也擁有自己的 val 值,這個值是指向一個 zval_struct.value
的。他們都擁有自己的 引用計數器 。
引用計數器用來記錄當前有多少 zval 指向同一個 zend_value 。
針對第六點,請看如下代碼:
- $a = ‘foo‘;
- $b = &$a;
- $c = $a;
此時的數據結構是這樣的:
$a 與 $b 各擁有一個 zval_struct容器,並且其中的 value 都指向同一個
zend_reference
結構, zend_reference
內嵌一個 val 結構, 指向同一個 zend_string , 字符串的內容 就儲存在其中。
而 $c 也擁有一個 zval_struct,而它的 value 在初始化的時候可以直接指向上面提到的 zend_string ,這樣在拷貝時就不會產生復制。
下面我們就聊一聊在這種全新的 zval 結構中,會出現的種種現象,和這些現象背後的原因。
問題
一. 為什麽某些變量的引用計數器的初始值為 0
現象
- $var_int = 233;
- $var_float = 233.3;
- $var_str = ‘233‘;
- xdebug_debug_zval(‘var_int‘);
- xdebug_debug_zval(‘var_float‘);
- xdebug_debug_zval(‘var_str‘);
- /** 輸出 **
- var_int:
- (refcount=0, is_ref=0)int 233
- var_float:
- (refcount=0, is_ref=0)float 233.3
- var_str:
- (refcount=0, is_ref=0)string ‘233‘ (length=3)
- **********/
原因
在 PHP7 中,為一個變量賦值的時候,包含了兩部分操作:
- 為符號量(即變量名)申請一個 zval_struct結構
- 將變量的值儲存到 zval_struct.value中 對於 zval 在 value 字段中能保存下的值,就不會在對他們進行引用計數, 而是在拷貝的時候直接賦值 ,這部分類型有:
- IS_LONG
- IS_DOUBLE
即我們在 PHP 中的 整形 與 浮點型 。
那麽 var_str 的 refcount 為什麽也是 0 呢?
這就牽扯到 PHP 中字符串的兩種類型:
1.interned string 內部字符串(函數名、類名、變量名、靜態字符串):
$str = ‘233‘; // 靜態字符串
2.普通字符串:
$str = ‘233‘ . time();
對於 內部字符串 而言,字符串的內容是唯一不變的,相當於 C 語言中定義在靜態變量區的字符串, 他們的生存周期存在於整個請求期間,request 完成後會統一銷毀釋放 ,自然也就無需通過引用計數進行內存管理。
二. 為什麽在對整形、浮點型和靜態字符串型變量進行引用賦值時,計數器的值會直接變為2
現象
- $var_int_1 = 233;
- $var_int_2 = &var_int;
- xdebug_debug_zval(‘var_int_1‘);
- /** 輸出 **
- var_int:
- (refcount=2, is_ref=1)int 233
- **********/
原因
回憶一下我們開頭講的 zval_struct中 value 的數據結構,當為一個變量賦 整形 、 浮點型 或 靜態字符串 類型的值時,value 的數據類型為 zend_long 、 double 或 zend_string ,這時值是可以直接儲存在 value 中的。而按值拷貝時,會開辟一個新的 zval_struct以同樣的方式將值儲存到相同數據類型的 value 中,所以 refcount 的值一直都會為 0。
但是當使用 & 操作符進行引用拷貝時,情況就不一樣了:
- PHP 為 & 操作符操作的變量申請一個 zend_reference結構
- 將 zend_reference.value 指向原來的 zval_struct.value
- zval_struct.value的數據類型會被修改為 zend_refrence
- 將 zval_struct.value指向剛剛申請並初始化後的 zend_reference
- 為新變量申請 zval_struct結構,將他的 value 指向剛剛創建的 zend_reference
此時: var_int_2 都擁有一個 zval_struct結構體,並且他們的 zval_struct.value都指向了同一個 zend_reference結構,所以該結構的引用計數器的值為 2。
題外話:zend_reference又指向了一個整形或浮點型的 value,如果指向的 value 類型是 zend_string,那麽該 value 引用計數器的值為 1。而 xdebug 出來的 refcount 顯示的是 zend_reference的計數器值(即 2)
三. 為什麽初始數組的引用計數器的值為 2
現象
- $var_empty_arr = [1, 2, ‘3‘];
- xdebug_debug_zval(‘var_empty_arr‘);
- /** 輸出 **
- var_arr:
- (refcount=3, is_ref=0)
- array (size=3)
- 0 => (refcount=0, is_ref=0)int 1
- 1 => (refcount=0, is_ref=0)int 2
- 2 => (refcount=1, is_ref=0)string ‘3‘ (length=1)
- **********/
原因
這牽扯到 PHP7 中的另一個概念,叫做 immutable array (不可變數組)。 關於 immutable array 的詳細介紹我放到下篇文章中講,這裏我們只需要知道,這樣定義的數組,叫做 不可變數組 。
For arrays the not-refcounted variant is called an "immutable array". If you use opcache, then constant array literals in your code will be converted into immutable arrays. Once again, these live in shared memory and as such must not use refcounting. Immutable arrays have a dummy refcount of 2, as it allows us to optimize certain separation paths.
不可變數組和我們上面講到的 內部字符串 一樣,都是 不使用引用計數 的,但是不同點是,內部字符串的計數值恒為 0,而不可變數組會使用一個 偽計數值 2。
參考文章:
- 深入解析PHP的引用計數機制
- PHP 應用容器化以及部署方法
- PHP解耦的三重境界(淺談服務容器)
深入理解 PHP7 中全新的 zval 容器和引用計數機制