이 기사에서는 "PHP8 기반 커널 소스 코드 분석 - 배열 (1)"을 소개합니다. 도움이 필요한 친구들이 모두 참고할 수 있기를 바랍니다.
관련 기사 추천: "PHP8의 기본 커널 소스 코드 분석 - 배열(2)" "PHP8의 기본 커널 소스 코드 분석 - 배열(3)" "기본 커널 분석 PHP8의 소스 코드 - 배열(4)"
PHP 배열은 변수(zval의 배열 포인터 유형)뿐만 아니라 심볼 테이블과 같은 커널에서도 자주 사용됩니다.
PHP8에서 배열은 _zendarray로 표현됩니다. 별칭은 zend_array와 hashtable
별칭이 두 개 있는 이유는 이전 하위 버전 함수와 호환되기 때문입니다(일부 함수나 매크로 코드에서 사용하는 것을 볼 수 있습니다). 현재 해시 테이블) 일부는 zend_array를 사용함)
PHP의 배열은 "양방향 정렬 다차원 연결 목록"입니다
두 가지 특성을 가집니다
하나. 키-값 쌍을
2개 저장합니다. Ordered
는 고급 해시 테이블로 이해할 수 있습니다
PHP8에서 배열의 정의는 zend_types.h에 있습니다. 핵심 코드는 다음과 같습니다
typedef struct _zend_array zend_array; //别名zend_array typedef struct _zend_array HashTable; //别名 HashTable struct _zend_array { zend_refcounted_h gc; //和zend_string一样 还记得前面的zend_string 吗? /// gc 占用8个字节 用于引用计数和 字符串类型的记录 union { struct { ZEND_ENDIAN_LOHI_4( zend_uchar flags, // flags 8位的无符号字符, 最大值为255 标记HashTable用 PHP8 中有6个值 //#define HASH_FLAG_CONSISTENCY ((1<<0) | (1<<1)) //#define HASH_FLAG_PACKED (1<<2) //#define HASH_FLAG_UNINITIALIZED (1<<3) //#define HASH_FLAG_STATIC_KEYS (1<<4) /* long and interned strings */ //#define HASH_FLAG_HAS_EMPTY_IND (1<<5) //#define HASH_FLAG_ALLOW_COW_VIOLATION (1<<6) zend_uchar _unused, zend_uchar nIteratorsCount, //迭代器计数。foreach语句会在全局变量EG中创建一个迭代器, //迭代器包含正在遍历的HashTable和游标信息。 //nIteratorsCount记录了当前runtime正在迭代当前HashTable的迭代器的数量。 zend_uchar _unused2) } v; //这里有点不一样 看陈雷大佬书中 v结构体还包括 u.v.nApplyCount和u.v.consistency uint32_t flags; // } u; // u是是一个联合体。占用4个字节。 //可以存储一个uint32_t类型的flags,也可以存储由4个unsigned char组成的结构体v, //这里的宏ZEND_ENDIAN_LOHI_4是为了兼容不同操作系统的大小端,可以忽略。 Bucket *arData; //HashTable中存储数据的单元的指针。 // 用来存储key和value以及辅助信息的容器。 uint32_t nTableSize; // HashTable的大小。表示arData指向的bucket数组的大小,即所有bucket的数量。 //该字段取值始终是2n,最小值是8,最大值在64位系统中是0x80000000(2的31次幂)。 uint32_t nNumUsed; //指所有已使用bucket的数量,包括有效bucket和无效bucket的数量 uint32_t nNumOfElements; //有效bucket的数量。该值总是小于或等于nNumUsed uint32_t nTableMask; //标记。一般值为 -nTableSize。 uint32_t nInternalPointer; //全局默认游标。reset/key/current/next/prev等宏 和操作都会用到 zend_long nNextFreeElement; //下一个插入的元素的key的下标 //比如 当$a[] = 1 nNextFreeElement =1 dtor_func_t pDestructor; //指向一个函数 typedef void (*dtor_func_t)(zval *pDest); //可以看出是pDest是zval结构指针二级指针, //为什么会是二级指针,因为c语言函数传递都是值传递,要改变指针值只能将指针地址传入 //当bucket元素被更新或者被删除时,会对bucket的value调用该函数, //如果value是引用计数的类型,那么会对value引用计数减1,进而引发可能的gc。 }; typedef struct _zend_refcounted_h { uint32_t refcount;//一个 32位纯数字的 refcount uint32_t type_info; } u; } zend_refcounted_h; //_zend_refcounted_h // 包括 一个 32位纯数字的 refcount 和一个联合体u //联合体u里面包括一个 type_infozend_refcounted_h 占用8字节,refount英文翻译成中文是引用的意思 显然 这个 zend_refcounted_h是为了引用计数和字符串类别存储用的。 typedef struct _Bucket { zval val; //数组的值 ( 复习下 zval只有16个字节) zend_ulong h; // key的 hash值 zend_string *key; //数组的key的 指针 /* string key or NULL for numerics */ } Bucket;
▏이 글은 동의를 얻어 PHP 중국어 사이트에 게재되었습니다. 원저자 PHP Cui Xuefeng의 원래 주소: https://zhuanlan.zhihu.com/p/352830733
위 내용은 PHP8 기본 커널 소스 코드 구문 분석 - 배열 (1)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!