這篇文章為大家介紹《解析PHP8底層核心原始碼-陣列(二)》。有一定的參考價值,有需要的朋友可以參考一下,希望對大家有幫助。
相關文章推薦:《解析PHP8底層核心源碼-陣列(一)》《解析PHP8底層核心原始碼-陣列(三)》《解析PHP8底層核心原始碼-陣列(四)》
zend_array 在 PHP中被分成兩種
1.packed array
2.hash array
在上文中 补齐了zend_array的 所有值的 注释
其實原始碼裡順序和我上面的稍微不一樣我覺得我上面的順序理解起來更合理
//源码里的代码 typedef struct _zend_array HashTable; struct _zend_array { zend_refcounted_h gc; union { struct { ZEND_ENDIAN_LOHI_4( zend_uchar flags, zend_uchar _unused, zend_uchar nIteratorsCount, zend_uchar _unused2) } v; uint32_t flags; } u; uint32_t nTableMask; Bucket *arData; uint32_t nNumUsed; uint32_t nNumOfElements; uint32_t nTableSize; uint32_t nInternalPointer; zend_long nNextFreeElement; dtor_func_t pDestructor; }; //我调换下顺序后的代码 struct _zend_array { zend_refcounted_h gc; /// gc 占用8个字节 用于引用计数和 字符串类型的记录 union { struct { ZEND_ENDIAN_LOHI_4( zend_uchar flags, // flags 8位的无符号字符, 最大值为255 标记HashTable用 PHP8 中有6个值 zend_uchar _unused, zend_uchar nIteratorsCount, //迭代器计数。foreach语句会在全局变量EG中创建一个迭代器, //迭代器包含正在遍历的HashTable和游标信息。 //nIteratorsCount记录了当前runtime正在迭代当前HashTable的迭代器的数量。 zend_uchar _unused2) } v; //这里有点不一样 看陈雷大佬书中 v结构体还包括 u.v.nApplyCount和u.v.consistency uint32_t flags; // } u; // u是是一个联合体。占用4个字节。 //可以存储一个uint32_t类型的flags,也可以存储由4个unsigned char组成的结构体v, //这里的宏ZEND_ENDIAN_LOHI_4是为了兼容不同操作系统的大小端,可以忽略。 Bucket *arData; //HashTable中存储数据的单元的指针。 // 用来存储key和value以及辅助信息的容器。 uint32_t nTableSize; // HashTable的大小。表示arData指向的bucket数组的大小,即所有bucket的数量。 //该字段取值始终是2n,最小值是8,最大值在64位系统中是0x80000000(2的31次幂)。 uint32_t nNumUsed; //指所有已使用bucket的数量,包括有效bucket和无效bucket的数量 uint32_t nNumOfElements; //有效bucket的数量。该值总是小于或等于nNumUsed uint32_t nTableMask; //索引大小。一般值为 -nTableSize。 uint32_t nInternalPointer; //全局默认游标。reset/key/current/next/prev等宏 和操作都会用到 zend_long nNextFreeElement; //下一个插入的元素的key的下标 //比如 当$a[] = 1 nNextFreeElement =1 dtor_func_t pDestructor; //指向一个函数 typedef void (*dtor_func_t)(zval *pDest); //可以看出是pDest是zval结构指针二级指针, //为什么会是二级指针,因为c语言函数传递都是值传递,要改变指针值只能将指针地址传入 //当bucket元素被更新或者被删除时,会对bucket的value调用该函数, //如果value是引用计数的类型,那么会对value引用计数减1,进而引发可能的gc。 };
用understand 工具產生的成員變數圖如下
展開全部後如下
zend_array 結構體member
可以看出其實核心就是z_val zend_string zend_refcounted_h Bucket層層相扣
其中Bucket 儲存陣列的關鍵資訊
typedef struct _Bucket { zval val; //数组的值 ( 复习下 zval只有16个字节) zend_ulong h; // key的 h 值 zend_string *key; //当数组为 hash_array时候 会用到 也就是 key的值 } Bucket;
#不管陣列類型是packed_array 還是hash_array 最後都會儲存在Bucket中
當 key全是數字key 且 key依插入順序遞增的時候陣列型別為packed_array
packed array的特性
其中第三條和第四條你可以理解為PHP中數組如果不寫key 那麼就默認key就從0開始依次排序
$a =array(1,2,3); // packed array
$b =array(1=>'a',3=>'b',5=>'c'); //packed array
bucket 陣列前會有索引陣列
當為packed array 時 索引陣列得大小一直為2 因為用不到它
上面當$a 對應的 zend_array裡的內容為
#nTableSize; 表示arData所指向的bucket陣列的大小,即所有bucket的數量。 =陣列的總大小
nNumUsed; 指所有使用bucket的數量,包括有效bucket和無效bucket的數量
使用
nNumOfElements; 有效bucket的數量。
所以 nNumOfElements nNumUsed =nTableSize
nTableMask; 索引大小。因為packed array 沒有用到索引所以永遠為-2
nNextFreeElement; 下一個插入的元素的key的下標
packed array 利用了bucket數組的連續性特點,對於某些只有數字key的場景進行的最佳化。由於不再需要索引數組,從記憶體空間上節省了(nTableSize-2 )* sizeof(uint32_t) 個位元組。另外,由於存取bucket是直接操作bucket數組,因此在效能上也有所提升。
如果未滿足packed array 的條件 在PHP中陣列用hash_array表示
所有key 值不是數字的都用hash_array 表示
$c =array('x'=>1,'y'=>2,'z'=>3,'a'=>0);
上面的$c 會被用hash_array 表示
bucket如下
zend_array如下
#nTableSize; 表示arData所指向的bucket陣列的大小,即所有bucket的數量。 =8
nNumUsed; 指所有使用bucket的數量,包括有效bucket和無效bucket的數量=4
nNumOfElements; 有效bucket的數量。 =4
所以 nNumOfElements nNumUsed =nTableSize
#nTableMask; 索引大小。 -8
nNextFreeElement; 下一個插入的元素的key的下標 hash_array 用不到永遠為0
▏本文經原作者PHP崔雪峰同意,發佈在php中文網,原文網址:https://zhuanlan.zhihu.com/p/358354087
以上是解析PHP8底層內核源碼-陣列(二)的詳細內容。更多資訊請關注PHP中文網其他相關文章!