PHP 配列の基礎となる実装ロジックの包括的な分析-PHPチュートリアル-php.cn

ホームページ

バックエンド開発

PHPチュートリアル

PHP 配列の基礎となる実装ロジックの包括的な分析

PHPz

Feb 29, 2024 pm 10:17 PM

php配列後部オープンソースPHPプログラミングバックエンド開発typedefロジックの実装配列を解析する

はじめに

php エディタ Banana は、PHP 配列の基礎となる実装ロジックを包括的に分析します。 PHP の配列は柔軟で強力なデータ構造ですが、その背後にある実装ロジックは非常に複雑です。この記事では、配列の内部構造、インデックスとハッシュテーブルの関係、配列の追加、削除、変更、クエリ操作の実装方法など、PHP 配列の基礎となる原則を詳しく説明します。 PHP 配列の基礎となる実装ロジックを理解することで、開発者は重要なデータ構造である配列をより深く理解し、利用できるようになります。

配列の構造

PHP カーネルでは配列はどのように見えるのでしょうか? PHP の ソースコード から構造を次のように確認できます。

<code>// 定义结构体别名为 HashTable
typedef struct _zend_array HashTable;

struct _zend_array {
	// <strong class="keylink">GC</strong> 保存引用计数，内存管理相关；本文不涉及
	zend_refcounted_h gc;
	// u 储存辅助信息；本文不涉及
	u<strong class="keylink">NIO</strong>n {
		struct {
			ZEND_ENDIAN_LOHI_4(
				zend_uchar    flags,
				zend_uchar    nApplyCount,
				zend_uchar    nIteratorsCount,
				zend_uchar    consistency)
		} v;
		uint32_t flags;
	} u;
	// 用于散列函数
	uint32_t          nTableMask;
	// arData 指向储存元素的数组第一个 Bucket，Bucket 为统一的数组元素类型
	Bucket           *arData;
	// 已使用 Bucket 数
	uint32_t          nNumUsed;
	// 数组内有效元素个数
	uint32_t          nNumOfElements;
	// 数组总容量
	uint32_t          nTableSize;
	// 内部指针，用于遍历
	uint32_t          nInternalPointer;
	// 下一个可用数字<strong class="keylink">索引</strong>
	zend_long         nNextFreeElement;
	// 析构函数
	dtor_func_t       pDestructor;
};</code>

##nNum Used と nNumOfElements の違い: nNumused は、arData 配列で使用されている Bucket 番号を参照します。配列は、要素の Bucket に対応する値を置き換えるだけであるためです。要素を削除した後、型は IS_UNDEF に設定されます (要素が削除されるたびに配列を移動して再インデックスするのは時間の無駄であるため)、nNumOfElements配列内の実際の要素数に対応します。
nTableSize 配列の容量。この値は 2 の累乗です。 PHPの配列は可変長ですが、C言語の配列は固定長です PHPの可変長配列の機能を実現するために、nTableSizeが正しいかどうかを判定する「展開」の仕組みが採用されています。要素が挿入されるたびに決定されるため、保存するだけで十分です。不十分な場合は、nTableSize の 2 倍のサイズの新しい配列を再適用し、元の配列をコピーします (この時点で、元の配列）とインデックスを再作成します。
次に使用可能な数値インデックスを保存します (PHP など)
$a[] = 1; この使用法ではインデックスが挿入されます。 nNextFreeElement の要素、その後 nNextFreeElement が 1 ずつ増加します。

この構造体については最初に説明しますが、構造体の一部のメンバーの機能については後で説明しますので、心配しないでください O(∩_∩)あはは～。配列メンバーとしての

Bucket 構造体を見てみましょう:

<code>typedef struct _Bucket {
	// 数组元素的值
	zval              val;
	// key 通过 Time 33 <strong class="keylink">算法</strong>计算得到的哈希值或数字索引
	zend_ulong        h;
	// 字符键名，数字索引则为 NULL
	zend_string      *key;
} Bucket;</code>

配列アクセスPHP 配列は一般的なハッシュとは異なり、ハッシュテーブルに基づいて実装されることがわかります。テーブル違いは、PHP の配列が要素の順序付けも実装していることです、つまり、挿入された要素はメモリの観点からは連続的であり、順序が乱れていません。この順序付けを実現するために、PHP は「マッピングテーブル」テクノロジを使用します。以下は、PHP 配列 :-D の要素にアクセスする方法を示す図です。

全面剖析PHP 数组底层实现逻辑注: マッピングテーブルの添字のキー名は 2 回ハッシュ化されているため、区別するために、この記事では最初のハッシュを参照するためにハッシュを使用します。 . ハッシュは 2 番目のハッシュです。

図からわかるように、マッピングテーブルと配列要素は同じ連続メモリ上にあります。マッピングテーブルは記憶要素と同じ長さの整数配列です。そのデフォルト値は次のとおりです。 -1 で、有効な値は Bucket

です。配列の添字です。そして、

HashTable->arData は、このメモリ内の Bucket 配列の最初の要素を指します。 例:$a['key']

配列

$a 内のキーが key であるメンバーにアクセスします。プロセスは次のようになります。最初のパス Time 33 アルゴリズムは、key のハッシュ値を計算し、マッピングテーブルに保存されている値は Bucket# であるため、ハッシュアルゴリズムを使用してハッシュ値に対応するマッピングテーブルの添字を計算します。 ## 配列内の添字値。Bucket 配列内の対応する要素を取得できます。次に、ハッシュアルゴリズムについて説明します。ハッシュアルゴリズムは、キー名のハッシュ値を「マッピングテーブル」の添え字にマッピングするアルゴリズムです。実際、これは非常に簡単で、たった 1 行のコードです: <pre class="brush:php;toolbar:false"><code>nIndex = h | ht->nTableMask;</code></pre> OR ハッシュ値と

nTableMask

を使用して、マッピングテーブルの添字を取得します。ここで、

nTableMask の値は、

は ##nTableSize の負の数です。 nTableSize の値は 2 の累乗であるため、h | ht->nTableMask の値の範囲は [-nTableSize, -1] になります。間、マッピングテーブルの添え字の範囲内に正確にあります。なぜ単純な「剰余」演算を使用せず、わざわざ「ビットごとの OR」演算を使用するのでしょうか? 「ビットごとの OR」演算は「剰余」演算よりもはるかに高速であるため、この頻繁に使用される演算については、より複雑な実装によってもたらされる時間 最適化 は価値があると思います。 ハッシュ競合異なるキー名のハッシュ値をハッシュ計算して得られる「マッピングテーブル」の添字が同一である場合があり、ハッシュ競合が発生します。この状況に対して、PHP は「チェーンアドレス方式」を使用して解決します。ハッシュ競合が発生した要素へのアクセスの状況を次の図に示します。

这看似与第一张图差不多，但我们同样访问 $a['key'] 的过程多了一些步骤。首先通过散列运算得出映射表下标为 -2 ，然后访问映射表发现其内容指向 arData 数组下标为 1 的元素。此时我们将该元素的 key 和要访问的键名相比较，发现两者并不相等，则该元素并非我们所想访问的元素，而元素的 val.u2.next 保存的值正是下一个具有相同散列值的元素对应 arData 数组的下标，所以我们可以不断通过 next 的值遍历直到找到键名相同的元素或查找失败。

插入元素

插入元素的函数 _zend_hash_add_or_update_i ，基于 PHP 7.2.9 的代码如下：

<code>static zend_always_inline zval *_zend_hash_add_or_update_i(HashTable *ht, zend_string *key, zval *pData, uint32_t flag ZEND_FILE_LINE_DC) { zend_ulong h; uint32_t nIndex; uint32_t idx; Bucket *p; IS_CONSISTENT(ht); HT_ASSERT_RC1(ht); if (UNEXPECTED(!(ht->u.flags & HASH_FLAG_INITIALIZED))) { // 数组未初始化 // 初始化数组 CHECK_INIT(ht, 0); // 跳转至插入元素段 goto add_to_hash; } else if (ht->u.flags & HASH_FLAG_PACKED) { // 数组为连续数字索引数组 // 转换为关联数组 zend_hash_packed_to_hash(ht); } else if ((flag & HASH_ADD_NEW) == 0) { // 添加新元素 // 查找键名对应的元素 p = zend_hash_find_bucket(ht, key); if (p) { // 若相同键名元素存在 zval *data; if (flag & HASH_ADD) { // 指定 add 操作 if (!(flag & HASH_UPDATE_INDIRECT)) { // 若不允许更新间接类型变量则直接返回 return NULL; } // 确定当前值和新值不同 ZEND_ASSERT(&p->val != pData); // data 指向原数组成员值 data = &p->val; if (Z_TYPE_P(data) == IS_INDIRECT) { // 原数组元素变量类型为间接类型 // 取间接变量对应的变量 data = Z_INDIRECT_P(data); if (Z_TYPE_P(data) != IS_UNDEF) { // 该对应变量存在则直接返回 return NULL; } } else { // 非间接类型直接返回 return NULL; } } else { // 没有指定 add 操作 // 确定当前值和新值不同 ZEND_ASSERT(&p->val != pData); // data 指向原数组元素值 data = &p->val; // 允许更新间接类型变量则 data 指向对应的变量 if ((flag & HASH_UPDATE_INDIRECT) && Z_TYPE_P(data) == IS_INDIRECT) { data = Z_INDIRECT_P(data); } } if (ht->pDestructor) { // 析构函数存在 // 执行析构函数 ht->pDestructor(data); } // 将 pData 的值复制给 data ZVAL_COPY_VALUE(data, pData); return data; } } // 如果哈希表已满，则进行扩容 ZEND_HASH_IF_FULL_DO_RESIZE(ht); add_to_hash: // 数组已使用 Bucket 数 +1 idx = ht->nNumUsed++; // 数组有效元素数目 +1 ht->nNumOfElements++; // 若内部指针无效则指向当前下标 if (ht->nInternalPointer == HT_INVALID_IDX) { ht->nInternalPointer = idx; } zend_hash_iterators_update(ht, HT_INVALID_IDX, idx); // p 为新元素对应的 Bucket p = ht->arData + idx; // 设置键名 p->key = key; if (!ZSTR_IS_INTERNED(key)) { zend_string_addref(key); ht->u.flags &= ~HASH_FLAG_STATIC_KEYS; zend_string_hash_val(key); } // 计算键名的哈希值并赋值给 p p->h = h = ZSTR_H(key); // 将 pData 赋值该 Bucket 的 val ZVAL_COPY_VALUE(&p->val, pData); // 计算映射表下标 nIndex = h | ht->nTableMask; // 解决冲突，将原映射表中的内容赋值给新元素变量值的 u2.next 成员 Z_NEXT(p->val) = HT_HASH(ht, nIndex); // 将映射表中的值设为 idx HT_HASH(ht, nIndex) = HT_IDX_TO_HASH(idx); return &p->val; }</code>

扩容

前面将数组结构的时候我们有提到扩容，而在插入元素的代码里有这样一个宏 ZEND_HASH_IF_FULL_DO_RESIZE，这个宏其实就是调用了 zend_hash_do_resize 函数，对数组进行扩容并重新索引。注意：并非每次 Bucket 数组满了都需要扩容，如果 Bucket 数组中 IS_UNDEF 元素的数量占较大比例，就直接将 IS_UNDEF 元素删除并重新索引，以此节省内存。下面我们看看 zend_hash_do_resize 函数：

重新索引的逻辑在 zend_hash_rehash 函数中，代码如下：

总结

嗯哼，本文就到此结束了，因为自身水平原因不能解释的十分详尽清楚。这算是我写过最难写的内容了，写完之后似乎觉得这篇文章就我自己能看明白/(ㄒoㄒ)/~~因为文笔太辣鸡。想起一句话「如果你不能简单地解释一样东西，说明你没真正理解它。」PHP 的源码里有很多细节和实现我都不算熟悉，这篇文章只是一个我的 PHP 底层学习的开篇，希望以后能够写出真正深入浅出的好文章。

以上がPHP 配列の基礎となる実装ロジックの包括的な分析の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は编程网で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

YOLOv6又快又准的目标检测框架已经开源了May 09, 2023 pm 02:52 PM

作者：楚怡、凯衡等近日，美团视觉智能部研发了一款致力于工业应用的目标检测框架YOLOv6，能够同时专注于检测的精度和推理效率。在研发过程中，视觉智能部不断进行了探索和优化，同时吸取借鉴了学术界和工业界的一些前沿进展和科研成果。在目标检测权威数据集COCO上的实验结果显示，YOLOv6在检测精度和速度方面均超越其他同体量的算法，同时支持多种不同平台的部署，极大简化工程部署时的适配工作。特此开源，希望能帮助到更多的同学。1.概述YOLOv6是美团视觉智能部研发的一款目标检测框架，致力于工业应用。

MLC LLM：开源AI聊天机器人，支持离线运行，适用于集成显卡电脑和iPhone。May 06, 2023 pm 03:46 PM

5月2日消息，目前大多数AI聊天机器人都需要连接到云端进行处理，即使可以本地运行的也配置要求极高。那么是否有轻量化的、无需联网的聊天机器人呢？一个名为MLCLLM的全新开源项目已在GitHub上线，完全本地运行无需联网，甚至集显老电脑、苹果iPhone手机都能运行。MLCLLM项目介绍称：“MLCLLM是一种通用解决方案，它允许将任何语言模型本地部署在一组不同的硬件后端和本地应用程序上，此外还有一个高效的框架，供每个人进一步优化自己用例的模型性能。一切都在本地运行，无需服务器支持，并通过手机和笔

基于开源的 ChatGPT Web UI 项目，快速构建属于自己的 ChatGPT 站点Apr 15, 2023 pm 07:43 PM

作为一个技术博主，了不起比较喜欢各种折腾，之前给大家介绍过ChatGPT接入微信，钉钉和知识星球（如果没看过的可以翻翻前面的文章），最近再看开源项目的时候，发现了一个ChatGPTWebUI项目。想着刚好之前没有将ChatGPT接入过WebUI，有了这个开源项目可以拿来使用，真是不错，下面是实操的安装步骤，分享给大家。安装官方在Github的项目文档上提供了很多中的安装方式，包括手动安装，docker部署，以及远程部署等方法，了不起在选择部署方式的时候，一开始为了简单想着

仅需1% Embedding参数，硬件成本降低十倍，开源方案单GPU训练超大推荐模型Apr 12, 2023 pm 03:46 PM

深度推荐模型（DLRMs）已经成为深度学习在互联网公司应用的最重要技术场景，如视频推荐、购物搜索、广告推送等流量变现业务，极大改善了用户体验和业务商业价值。但海量的用户和业务数据，频繁地迭代更新需求，以及高昂的训练成本，都对 DLRM 训练提出了严峻挑战。在 DLRM 中，需要先在嵌入表（EmbeddingBags）中进行查表（lookup），再完成下游计算。嵌入表常常贡献 DLRM 中 99% 以上的内存需求，却只贡献 1% 的计算量。借助于 GPU 片上高速内存（High Bandwidth

Stable Diffusion-XL开启公测，让你摆脱繁琐的长prompt！Apr 23, 2023 am 10:16 AM

自从Midjourney发布v5之后，在生成图像的人物真实程度、手指细节等方面都有了显著改善，并且在prompt理解的准确性、审美多样性和语言理解方面也都取得了进步。相比之下，StableDiffusion虽然免费、开源，但每次都要写一大长串的prompt，想生成高质量的图像全靠多次抽卡。最近StabilityAI的官宣，正在研发的StableDiffusionXL开始面向公众测试，目前可以在Clipdrop平台免费试用。试用链接：https://clipdrop.co/stable-diff

用图像对齐所有模态，Meta开源多感官AI基础模型，实现大一统May 11, 2023 pm 07:25 PM

在人类的感官中，一张图片可以将很多体验融合到一起，比如一张海滩图片可以让我们想起海浪的声音、沙子的质地、拂面而来的微风，甚至可以激发创作一首诗的灵感。图像的这种「绑定」（binding）属性通过与自身相关的任何感官体验对齐，为学习视觉特征提供了大量监督来源。理想情况下，对于单个联合嵌入空间，视觉特征应该通过对齐所有感官来学习。然而这需要通过同一组图像来获取所有感官类型和组合的配对数据，显然不可行。最近，很多方法学习与文本、音频等对齐的图像特征。这些方法使用单对模态或者最多几种视觉模态。最终嵌入仅

首个大众可用PyTorch版AlphaFold2复现，哥大开源，star量破千Apr 13, 2023 am 09:58 AM

刚刚，哥伦比亚大学系统生物学助理教授 Mohammed AlQuraishi 在推特上宣布，他们从头训练了一个名为 OpenFold 的模型，该模型是 AlphaFold2 的可训练 PyTorch 复现版本。Mohammed AlQuraishi 还表示，这是第一个大众可用的 AlphaFold2 复现。AlphaFold2 可以周期性地以原子精度预测蛋白质结构，在技术上利用多序列对齐和深度学习算法设计，并结合关于蛋白质结构的物理和生物学知识提升了预测效果。它实现了 2/3 蛋白质结构预测的卓

基于PyTorch、易上手，细粒度图像识别深度学习工具库Hawkeye开源Apr 12, 2023 pm 08:43 PM

细粒度图像识别 [1] 是视觉感知学习的重要研究课题，在智能新经济和工业互联网等方面具有巨大应用价值，且在诸多现实场景已有广泛应用…… 鉴于当前领域内尚缺乏该方面的深度学习开源工具库，南京理工大学魏秀参教授团队用时近一年时间，开发、打磨、完成了 Hawkeye——细粒度图像识别深度学习开源工具库，供相关领域研究人员和工程师参考使用。本文是对 Hawkeye 的详细介绍。1.什么是 Hawkeye 库Hawkeye 是一个基于 PyTorch 的细粒度图像识别深度学习工具库，专为相关领域研究人员和

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティングサービスをチェックしてください。

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。