Home >php教程 >php手册 >PHP数组实际占用内存大小的分析

PHP数组实际占用内存大小的分析

WBOY
WBOYOriginal
2016-06-06 19:54:261198browse

http://blog.csdn.net/hguisu/article/details/7376705 我们在前面的php高效写法提到,尽量不要复制变量,特别是数组。 一般来说,PHP数组的内存利用率只有 1/10, 也就是说,一个在C语言里面100M 内存的数组,在PHP里面就要1G。下面我们可以粗略的估算PHP数

http://blog.csdn.net/hguisu/article/details/7376705

我们在前面的php高效写法提到,尽量不要复制变量,特别是数组。一般来说,PHP数组的内存利用率只有 1/10, 也就是说,一个在C语言里面100M 内存的数组,在PHP里面就要1G。下面我们可以粗略的估算PHP数组占用内存的大小,首先我们测试1000个元素的整数占用的内存:

<?php echo memory_get_usage() , '<br>';  
    $start = memory_get_usage();  
    $a = Array();  
    for ($i=0; $i';  
    for ($i=1000; $i';  
    echo 'argv:', ($mid - $start)/1024 ,'kb' , '<br>';  
    echo 'argv:',($end - $mid)/1024 ,'kb' , '<br>';  

输出是:

350752
435248
519424
argv:84.416byte
argv:84.176byte

大概了解1000 个元素的整数数组需要占用 82k 内存,平均每个元素占用 84 个字节。而纯 C 中整体只需要 4k(一个整型占用4byte * 1000 )。memory_get_usage() 返回的结果并不是全是被数组占用了,还要包括一些 PHP 运行本身分配的一些结构,可能用内置函数生成的数组更接近真实的空间:

<?php $start = memory_get_usage(true);  
    $a = array_fill(0, 10000, 1);  
    $mid = memory_get_usage(true); //10k elements array;   
    echo 'argv:', ($mid - $start )/10000,'byte' , '<br>';  
    $b = array_fill(0, 10000, 1);  
    $end = memory_get_usage(true); //10k elements array;   
    echo 'argv:', ($end - $mid)/10000 ,'byte' , '<br>';  

得到:
argv:54.5792byte
argv:54.5792byte

从这个结果来看似乎一个数组元素大约占用了54个左右的字节。再看看数组在Zend里面的C结构,PHP中的数组变量,首先需要一个 zval 结构:
struct _zval_struct {
   zvalue_value value;
   zend_uint refcount__gc;
   zend_uchar type;
   zend_uchar is_ref__gc;
};
zvalue_value 是一个union:
typedef union _zvalue_value {
   long lval;
   double dval;
   struct {
       char *val;
       int len;
   } str;
   HashTable *ht;
   zend_object_value obj;
} zvalue_value;

通常 zval 结构需要 8+6=14 个字节,PHP中每个变量都有对应的 zval,但是数组,字符串和对象还需要另外的存储结构,而数组则是一个 HashTable :
typedef struct _hashtable {
    uint nTableSize;
    uint nTableMask;
    uint nNumOfElements;
    ulong nNextFreeElement;
    Bucket *pInternalPointer;
    Bucket *pListHead;
    Bucket *pListTail;
    Bucket **arBuckets;
    dtor_func_t pDestructor;
    zend_bool persistent;
    unsigned char nApplyCount;
    zend_bool bApplyProtection;
} HashTable;
HashTable 结构需要 40 个字节,每个数组元素存储在 Bucket 结构中:
typedef struct bucket {
    ulong h;
    uint nKeyLength;
    void *pData;
    void *pDataPtr;
    struct bucket *pListNext;
    struct bucket *pListLast;
    struct bucket *pNext;
    struct bucket *pLast;
    char arKey[1];
} Bucket;
Bucket 结构需要 36 个字节,键长超过四个字节的部分附加在 Bucket 后面,而元素值很可能是一个 zval 结构,另外每个数组会分配一个由 arBuckets 指向的 Bucket 指针数组, 虽然不能说每增加一个元素就需要一个指针,但是实际情况可能更糟。这么算来一个数组元素就会占用 54 个字节,与上面的估算几乎一样。
    一个空数组至少会占用 14(zval) + 40(HashTable) + 32(arBuckets) = 86 个字节,作为一个变量应该在符号表中有个位置,也是一个数组元素,因此一个空数组变量需要 118 个字节来描述和存储。从空间的角度来看,小型数组平均代价较大,当然一个脚本中不会充斥数量很大的小型数组,可以以较小的空间代价来获取编程上的快捷。但如果将数组当作容器来使用就是另一番景象了,实际应用经常会遇到多维数组,而且元素居多。比如10k个元素的一维数组大概消耗540k内存,而10k x 10 的二维数组理论上只需要 6M 左右的空间,但是按照 memory_get_usage 的结果则两倍于此,[10k,5,2]的三维数组居然消耗了23M,小型数组果然是划不来的。

Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn