PHP の配列と値はどれくらいの大きさですか?-PHPチュートリアル-php.cn

ホームページ

バックエンド開発

PHPチュートリアル

PHP の配列と値はどれくらいの大きさですか?

藏色散人

Jan 28, 2019 pm 04:03 PM

この記事は、PHP 5 のメモリ使用量について説明しています。この記事で説明されている状況では、PHP 7 ではメモリ使用量が約 3 倍低くなります。

PHP の配列と値はどれくらいの大きさですか?

この投稿では、100000 個の一意の整数配列を作成する次のスクリプトを例として使用して、PHP 配列 (および一般的な値) のメモリ使用量を調べたいと思います。要素を取得し、結果のメモリ使用量を測定しました:

$startMemory = memory_get_usage();
$array = range(1, 100000);
echo memory_get_usage() - $startMemory, &#39; bytes&#39;;

What do you want it to be? 簡単に言えば、整数は 8 バイトです (64 ビット UNIX マシンでは long 型を使用)。 100,000 個の整数なので、明らかに 800,000 バイトが必要です。

次に、上記のコードを実行してみます。これにより、14649024 バイトが得られます。そうです。13.97 MB で、推定値の 18 倍です。

それでは、追加の因数 18 はどこから来たのでしょうか?

概要

ストーリー全体を知りたくない人のために、関係するものは次のとおりです。さまざまなコンポーネントのメモリ使用量を簡単にまとめます。

                             |  64 bit   | 32 bit
---------------------------------------------------
zval                         |  24 bytes | 16 bytes
+ cyclic GC info             |   8 bytes |  4 bytes
+ allocation header          |  16 bytes |  8 bytes
===================================================
zval (value) total           |  48 bytes | 28 bytes
===================================================
bucket                       |  72 bytes | 36 bytes
+ allocation header          |  16 bytes |  8 bytes
+ pointer                    |   8 bytes |  4 bytes
===================================================
bucket (array element) total |  96 bytes | 48 bytes
===================================================
total total                  | 144 bytes | 76 bytes

上記の数値は、オペレーティングシステム、コンパイラ、およびコンパイルオプションによって異なります。たとえば、デバッグセーフまたはスレッドセーフを使用して PHP をコンパイルすると、異なる数値が得られます。ただし、上記のサイズは、Linux 上の PHP 5.3 の 64 ビット製品バージョンで表示されるものだと思います。

これらの 144 バイトに 100,000 要素を掛けると、14,400,000 バイト、つまり 13.73 MB が得られます。これは実際の数値に非常に近い値です。残りの大部分は初期化されていないバケットポインターですが、これについては後で説明します。後で。

ここで、上記の値のより詳細な分析が必要な場合は、読み続けてください:)

zvalue_value Alliance

まず、PHP が値をどのように保存するかを見てください。ご存知のとおり、PHP は型指定が弱い言語であるため、型をすばやく切り替える何らかの方法が必要です。 PHP はこれに Union を使用します。これは zend で次のように定義されています。

typedef union _zvalue_value {
    long lval;                // For integers and booleans
    double dval;              // For floats (doubles)
    struct {                  // For strings
        char *val;            //     consisting of the string itself
        int len;              //     and its length
    } str;
    HashTable *ht;            // For arrays (hash tables)
    zend_object_value obj;    // For objects
} zvalue_value;

C の知識がない場合でも、コードは非常に単純なので問題ありません。ユニオンは、特定の値をさまざまな型としてアクセスできるようにする方法です。たとえば、zvalue_value->lval を実行すると、整数として解釈される値が得られます。一方、zvalue_value->ht を使用すると、値はハッシュテーブル (配列) へのポインターとして解釈されます。

しかし、ここではあまり話さないようにしましょう。私たちにとって重要なのは、結合のサイズがその最大のコンポーネントのサイズと等しいことだけです。ここでの最大のコンポーネントは文字列構造体です (zend_object_value 構造体は str 構造体と同じサイズですが、簡単にするために省略します)。文字列構造体には、ポインター (8 バイト) と整数 (4 バイト) の合計 12 バイトが格納されます。メモリの調整 (12 バイトの構造体は 64 ビット/8 バイトの倍数ではないため、クールではありません) により、構造体の合計サイズは 16 バイトになり、これは共用体全体のサイズでもあります。

PHP の動的型付けにより、各値には 8 バイトではなく 16 バイトが必要であることがわかりました。 100000 の値を掛けると 1600000 バイト、つまり 1.53 MB になりますが、実際の値は 13.97 MB であるため、まだ取得できません。

zval の構造

これは非常に論理的です。ユニオンは値自体を保存するだけですが、PHP には明らかにストレージタイプといくつかのガベージコレクション情報も必要です。この情報を保持する構造は zval と呼ばれ、聞いたことがあるかもしれません。 PHP にそれが必要な理由について詳しくは、Sara Golemon による記事を読むことをお勧めします。とにかく、構造体は次のように定義されます:

struct _zval_struct {
    zvalue_value value;     // The value
    zend_uint refcount__gc; // The number of references to this value (for GC)
    zend_uchar type;        // The type
    zend_uchar is_ref__gc;  // Whether this value is a reference (&)
};

構造体のサイズは、そのコンポーネントのサイズの合計によって決まります: zvalue_value (上記のように計算) に 16 バイト、zend_uint に 4 バイト、および 1 zend_uchars のバイト。合計は 22 バイトです。メモリの調整により、実際のサイズは 24 バイトになります。

したがって、100,000 個の要素を 24 バイトに格納すると、合計は 2,400,000、つまり 2.29 MB となり、差は縮まりつつありますが、実際の値は依然として元の 6 倍を超えています。

循環コレクター (PHP 5.3 以降)

PHP 5.3 では、新しい循環参照ガベージコレクターが導入されました。これを行うには、PHP は追加データを保存する必要があります。このアルゴリズムがどのように機能するかについては、ここでは説明しません。マニュアルのリンク先のページで説明します。サイズ計算で重要なのは、PHP が各 zval を zval_gc_info:

typedef struct _zval_gc_info {
    zval z;
    union {
        gc_root_buffer       *buffered;
        struct _zval_gc_info *next;
    } u;
} zval_gc_info;

にラップすることです。ご覧のとおり、Zend は 2 つのポインター構成で構成される共用体をそれに追加するだけです。共用体のサイズはその最大のコンポーネントのサイズであることを覚えておいてください。両方の共用体コンポーネントはポインターであるため、サイズは両方とも 8 バイトです。したがって、union のサイズも 8 バイトになります。

これを 24 バイトに追加すると、すでに 32 バイトになります。 100000 要素を掛けると、メモリ使用量は 3.05 MB になります。

Zend MM Allocator

C PHP とは異なり、メモリを管理しません。自分の割り当てを自分で追跡する必要があります。これを行うために、PHP は、そのニーズに合わせて最適化されたカスタムメモリマネージャー、Zend Memory Manager を使用します。 Zend MM は Doug Lea の malloc に基づいており、PHP 固有の最適化と機能 (メモリ制限、各リクエスト後のクリーンアップなど) が追加されています。

ここで重要なことは、MM はそれを通じて行われるすべての割り当てに対して割り当てヘッダーを追加するということです。定義は次のとおりです:

typedef struct _zend_mm_block {
    zend_mm_block_info info;
#if ZEND_DEBUG
    unsigned int magic;
# ifdef ZTS
    THREAD_T thread_id;
# endif
    zend_mm_debug_info debug;
#elif ZEND_MM_HEAP_PROTECTION
    zend_mm_debug_info debug;
#endif
} zend_mm_block;

typedef struct _zend_mm_block_info {
#if ZEND_MM_COOKIES
    size_t _cookie;
#endif
    size_t _size; // size of the allocation
    size_t _prev; // previous block (not sure what exactly this is)
} zend_mm_block_info;

如您所见，这些定义充斥着大量的编译选项检查。如果你用堆保护，多线程，调试和MM cookie来构建PHP，那么如果你用堆保护，多线程，调试和MM cookie来构建PHP，那么如果你用堆保护，多线程，调试和MM cookie来构建PHP，那么分配头文件会更大。

对于本例，我们假设所有这些选项都是禁用的。在这种情况下，只剩下两个size_ts _size和_prev。size_t有8个字节(在64位上)，所以分配头的总大小是16个字节——并且在每个分配上都添加了这个头。

现在我们需要再次调整zval大小。实际上，它不是32字节，而是48字节，这是由分配头决定的。乘以100000个元素是4。58 MB，实际值是13。97 MB，所以我们已经得到了大约三分之一的面积。

Buckets

到目前为止，我们只考虑单个值。但是PHP中的数组结构也会占用大量空间:“数组”在这里实际上是一个不合适的术语。PHP数组实际上是散列表/字典。那么哈希表是如何工作的呢?基本上，对于每个键，都会生成一个散列，该散列用作“real”C数组的偏移量。由于哈希值可能会冲突，具有相同哈希值的所有元素都存储在链表中。当访问一个元素时，PHP首先计算散列，查找正确的bucket并遍历链接列表，逐个元素比较确切的键。bucket的定义如下:

typedef struct bucket {
    ulong h;                  // The hash (or for int keys the key)
    uint nKeyLength;          // The length of the key (for string keys)
    void *pData;              // The actual data
    void *pDataPtr;           // ??? What&#39;s this ???
    struct bucket *pListNext; // PHP arrays are ordered. This gives the next element in that order
    struct bucket *pListLast; // and this gives the previous element
    struct bucket *pNext;     // The next element in this (doubly) linked list
    struct bucket *pLast;     // The previous element in this (doubly) linked list
    const char *arKey;        // The key (for string keys)
} Bucket;

正如您所看到的，需要存储大量数据才能获得PHP使用的抽象数组数据结构(PHP数组同时是数组、字典和链表，这当然需要大量信息)。单个组件的大小为无符号long为8字节，无符号int为4字节，指针为7乘以8字节。总共是68。添加对齐，得到72字节。

像zvals这样的bucket需要在头部分配，因此我们需要再次为分配头添加16个字节，从而得到88个字节。我们还需要在“real”C数组中存储指向这些Bucket的指针(Bucket ** arbucket;)我上面提到过，每个元素增加8个字节。所以总的来说，每个bucket需要96字节的存储空间。

如果每个值都需要一个bucket，那么bucket是96字节，zval是48字节，总共144字节。对于100000个元素，也就是14400000字节，即13.73 MB。

神秘的解决。

等等，还有0.24 MB !

最后的0.24 MB是由于未初始化的存储bucket造成的:理想情况下，存储bucket的实际C数组的大小应该与存储的数组元素的数量大致相同。通过这种方式，冲突最少(除非希望浪费大量内存)。但是PHP显然不能在每次添加元素时重新分配整个数组——这将非常缓慢。相反，如果内部bucket数组达到限制，PHP总是将其大小加倍。所以数组的大小总是2的幂。

在我们的例子中是2 ^ 17 = 131072。但是我们只需要100000个bucket，所以我们留下31072个bucket没有使用。这些bucket不会被分配(因此我们不需要花费全部的96字节)，但是bucket指针(存储在内部桶数组中的那个)的内存仍然需要分配。所以我们另外使用8字节(一个指针)* 31072个元素。这是248576字节或0.23 MB，与丢失的内存匹配。(当然，这里仍然缺少一些字节，但是我不想在这里介绍。比如哈希表结构本身，变量等等)

神秘真的解决了。

这告诉我们什么?

PHP不是c，这就是所有这些告诉我们的。您不能期望像PHP这样的超级动态语言具有与C语言相同的高效内存使用。你不能。

但是，如果您确实想节省内存，可以考虑使用SplFixedArray处理大型静态数组。

看看这个修改后的脚本:

$startMemory = memory_get_usage();
$array = new SplFixedArray(100000);
for ($i = 0; $i < 100000; ++$i) {
    $array[$i] = $i;
}
echo memory_get_usage() - $startMemory, &#39; bytes&#39;;

它基本上做的是相同的事情，但是如果运行它，您会注意到它只使用了“5600640字节”。这是每个元素56字节，因此比普通数组使用的每个元素144字节要少得多。这是因为一个固定的数组不需要bucket结构:所以它只需要每个元素一个zval(48字节)和一个指针(8字节)，从而得到观察到的56字节。

以上がPHP の配列と値はどれくらいの大きさですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

PHPの現在のステータス：Web開発動向を見てくださいApr 13, 2025 am 12:20 AM

PHPは、現代のWeb開発、特にコンテンツ管理とeコマースプラットフォームで依然として重要です。 1）PHPには、LaravelやSymfonyなどの豊富なエコシステムと強力なフレームワークサポートがあります。 2）パフォーマンスの最適化は、Opcacheとnginxを通じて達成できます。 3）PHP8.0は、パフォーマンスを改善するためにJITコンパイラを導入します。 4）クラウドネイティブアプリケーションは、DockerおよびKubernetesを介して展開され、柔軟性とスケーラビリティを向上させます。

PHP対その他の言語：比較Apr 13, 2025 am 12:19 AM

PHPは、特に迅速な開発や動的なコンテンツの処理に適していますが、データサイエンスとエンタープライズレベルのアプリケーションには良くありません。 Pythonと比較して、PHPはWeb開発においてより多くの利点がありますが、データサイエンスの分野ではPythonほど良くありません。 Javaと比較して、PHPはエンタープライズレベルのアプリケーションでより悪化しますが、Web開発により柔軟性があります。 JavaScriptと比較して、PHPはバックエンド開発により簡潔ですが、フロントエンド開発のJavaScriptほど良くありません。

PHP対Python：コア機能と機能Apr 13, 2025 am 12:16 AM

PHPとPythonにはそれぞれ独自の利点があり、さまざまなシナリオに適しています。 1.PHPはWeb開発に適しており、組み込みのWebサーバーとRich Functionライブラリを提供します。 2。Pythonは、簡潔な構文と強力な標準ライブラリを備えたデータサイエンスと機械学習に適しています。選択するときは、プロジェクトの要件に基づいて決定する必要があります。

PHP：Web開発の重要な言語Apr 13, 2025 am 12:08 AM

PHPは、サーバー側で広く使用されているスクリプト言語で、特にWeb開発に適しています。 1.PHPは、HTMLを埋め込み、HTTP要求と応答を処理し、さまざまなデータベースをサポートできます。 2.PHPは、ダイナミックWebコンテンツ、プロセスフォームデータ、アクセスデータベースなどを生成するために使用され、強力なコミュニティサポートとオープンソースリソースを備えています。 3。PHPは解釈された言語であり、実行プロセスには語彙分析、文法分析、編集、実行が含まれます。 4.PHPは、ユーザー登録システムなどの高度なアプリケーションについてMySQLと組み合わせることができます。 5。PHPをデバッグするときは、error_reporting（）やvar_dump（）などの関数を使用できます。 6. PHPコードを最適化して、キャッシュメカニズムを使用し、データベースクエリを最適化し、組み込み関数を使用します。 7

PHP：多くのウェブサイトの基礎Apr 13, 2025 am 12:07 AM

PHPが多くのWebサイトよりも優先テクノロジースタックである理由には、その使いやすさ、強力なコミュニティサポート、広範な使用が含まれます。 1）初心者に適した学習と使用が簡単です。 2）巨大な開発者コミュニティと豊富なリソースを持っています。 3）WordPress、Drupal、その他のプラットフォームで広く使用されています。 4）Webサーバーとしっかりと統合して、開発の展開を簡素化します。

誇大広告を超えて：今日のPHPの役割の評価Apr 12, 2025 am 12:17 AM

PHPは、特にWeb開発の分野で、最新のプログラミングで強力で広く使用されているツールのままです。 1）PHPは使いやすく、データベースとシームレスに統合されており、多くの開発者にとって最初の選択肢です。 2）動的コンテンツ生成とオブジェクト指向プログラミングをサポートし、Webサイトを迅速に作成および保守するのに適しています。 3）PHPのパフォーマンスは、データベースクエリをキャッシュおよび最適化することで改善でき、その広範なコミュニティと豊富なエコシステムにより、今日のテクノロジースタックでは依然として重要になります。

PHPの弱い参照は何ですか、そしていつ有用ですか？Apr 12, 2025 am 12:13 AM

PHPでは、弱い参照クラスを通じて弱い参照が実装され、ガベージコレクターがオブジェクトの回収を妨げません。弱い参照は、キャッシュシステムやイベントリスナーなどのシナリオに適しています。オブジェクトの生存を保証することはできず、ごみ収集が遅れる可能性があることに注意する必要があります。

PHPで__invoke Magicメソッドを説明してください。Apr 12, 2025 am 12:07 AM

\ _ \ _ Invokeメソッドを使用すると、オブジェクトを関数のように呼び出すことができます。 1。オブジェクトを呼び出すことができるように\ _ \ _呼び出しメソッドを定義します。 2。$ obj（...）構文を使用すると、PHPは\ _ \ _ Invokeメソッドを実行します。 3。ロギングや計算機、コードの柔軟性の向上、読みやすさなどのシナリオに適しています。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティングサービスをチェックしてください。

メモ帳++7.3.1

使いやすく無料のコードエディター

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。