찾다

 >  Q&A  >  본문

php - memcached save 数据的一些疑问

众所周知,memcached保存的时候可以这样写:

$memcached->save("a", array("abc","bacd"), MEMCACHE_COMPRESSED, 0);

以及:

$memcached->save("a", json_encode(array("abc","bacd")), MEMCACHE_COMPRESSED, 0);

但,问题就来了,经过1W调数据测试,若 $data =array();中包含中文汉字 通过 json_encode 存入memcached后,明显要比直接存入array的速度要慢很多很多。

可是memcache的底层save的时候,如果传递的$value为array()那么采用serialize进行序列化。

可是,jsonencode和serialize的性能差异非常大,jsonencode明显会要比serialize要快许多。

求问,memcached最终传递什么值为好?array?还是string?

PHP中文网PHP中文网2834일 전441

모든 응답(2)나는 대답할 것이다

  • 巴扎黑

    巴扎黑2017-04-10 14:28:19

    json_encode明显要比serialize快很多?R U SURE?

    <?php
    $str = '但,问题就来了,经过1W调数据测试,若 $data =array();中包含中文汉字 通过 json_encode 存入memcached后,明显要比直接存入array的速度要慢很多很多。';
    
    function microtime_float() {
        list($usec, $sec) = explode(" ", microtime());
        return ((float)$usec + (float)$sec);
    }
    
    $time_start = microtime_float();
    for ($i = 2000000; $i > 0; $i--) serialize($str);
    printf("serialize: in %f seconds\n", microtime_float() - $time_start);
    
    $time_start = microtime_float();
    for ($i = 2000000; $i > 0; $i--) json_encode($str);
    printf("json_encode: in %f seconds\n", microtime_float() - $time_start);
    

    Run:
    serialize: in 0.928114 seconds
    json_encode: in 4.315019 seconds


    发现了上面的结论,下面可以直接被忽略了,仅供参考。

    @iCode的说法可能是一部分的原因;更重要的是,无论是serialize还是json_encode,肯定都是O(n)的,只是serialize的常数可能比json_encode大;然而,由于serialize是在memcache内部调用的,是直接了当地转换,存到sendbuf里,所以可以省掉相当的转换开销:

    //memcache_binary_protocol.c +416
    status = mmc_pack_value(pool, &(request->sendbuf), value, &flags TSRMLS_CC);
    => default:
         php_var_serialize(&(buffer->value), &value_copy_ptr, &value_hash TSRMLS_CC);
         ...;
         mmc_compress(pool, buffer, buffer->value.c + prev_len, buffer->value.len - prev_len, flags, 1 TSRMLS_CC);
    

    而json_encode则不然:必须先分配一块空间,存进去,生成一个对应的zval对象,扔回php,再由php交给memcache,然后:

    //memcache_binary_protocol.c +416
    status = mmc_pack_value(pool, &(request->sendbuf), value, &flags TSRMLS_CC);
    => case IS_STRING:
         *flags |= MMC_TYPE_STRING;
         mmc_compress(pool, buffer, Z_STRVAL_P(value), Z_STRLEN_P(value), flags, 0 TSRMLS_CC);
    

    可以想象,在这样一个过程中,使用json_encode的开销显著增加了。所以它比直接serialize更差是可以理解的。

    至于到底该用哪个,说真的,php本来性能就差得很,不用特别在意这个地方,它往往不太可能会是性能的瓶颈。如果真的觉得到了性能优化要抠这里的时候(估计你更可能会选择用其他语言重写,例如python)(或者恭喜你,可以去找投资人了),方法很多,再不济至少你可以直接修改memcache的源码,把php_var_serialize改成json_encode。

    회신하다
    0
  • PHP中文网

    PHP中文网2017-04-10 14:28:19

    <?php
    $str = '但,问题就来了,经过1W调数据测试,若 $data =array();中包含中文汉字 通过 json_encode 存入memcached后,明显要比直接存入array的速度要慢很多很多。';
    
    $jstr = json_encode( $str );
    $sstr = serialize( $str );
    
    echo strlen( $jstr ), ' | ', $jstr, PHP_EOL,
         strlen( $sstr ), ' | ', $sstr;
    
    /*
    336 | "\u4f46\uff0c\u95ee\u9898\u5c31\u6765\u4e86\uff0c\u7ecf\u8fc71W\u8c03\u6570\u636e\u6d4b\u8bd5\uff0c\u82e5 $data =array();\u4e2d\u5305\u542b\u4e2d\u6587\u6c49\u5b57 \u901a\u8fc7 json_encode \u5b58\u5165memcached\u540e\uff0c\u660e\u663e\u8981\u6bd4\u76f4\u63a5\u5b58\u5165array\u7684\u901f\u5ea6\u8981\u6162\u5f88\u591a\u5f88\u591a\u3002"
    199 | s:190:"但,问题就来了,经过1W调数据测试,若 $data =array();中包含中文汉字 通过 json_encode 存入memcached后,明显要比直接存入array的速度要慢很多很多。";
     */
    

    越长存起来就越慢的道理你是懂的吧 ..?

    회신하다
    0
  • 취소회신하다