首頁  >  文章  >  後端開發  >  PHP中被忽略的效能最佳化利器:生成器

PHP中被忽略的效能最佳化利器:生成器

小云云
小云云原創
2017-12-08 13:58:161280瀏覽

本文我們將和大家分享PHP中被忽略的效能最佳化利器:生成器的知識,希望能幫助大家。如果是做Python或其他語言的小夥伴,對於生成器應該不陌生。但很多PHP開發者或許都不知道生成器這個功能,可能是因為生成器是PHP 5.5.0才引進的功能,也可以是生成器作用不是很明顯。但是,生成器功能的確非常有用。

優點

直接講概念估計你聽完還是一頭霧水,所以我們先來說說優點,也許能勾起你的興趣。那麼生成器有哪些優點,如下:

  • 生成器會對PHP應用的效能有非常大的影響

  • PHP程式碼執行時節省大量的記憶體

  • 比較適合計算大量的資料

那麼,這些神奇的功能究竟是如何做到的呢?我們先來舉個例子。

概念引入

首先,放下生成器概念的包袱,來看一個簡單的PHP函數:

function createRange($number){
    $data = [];
    for($i=0;$i<$number;$i++){
        $data[] = time();
    }
    return $data;
}

這是一個非常常見的PHP函數,我們在處理一些數組的時候常常會被使用。這裡的程式碼也非常簡單:

  1. 我們建立一個函數。

  2. 函數內包含一個for循環,我們循環的把目前時間放到$data裡面

  3. #for迴圈執行完畢,把$data回來出去。

下面沒完,我們繼續。我們再寫一個函數,把這個函數的回傳值循環印出來:

$result = createRange(10); // 这里调用上面我们创建的函数
foreach($result as $value){
    sleep(1);//这里停顿1秒,我们后续有用
    echo $value.&#39;<br />';
}

我們在瀏覽器裡面看一下運行結果:

PHP中被忽略的效能最佳化利器:生成器

這裡非常完美,沒有任何問題。 (當然sleep(1)效果你們看不出來)

思考一個問題

我們注意到,在呼叫函數createRange的時候給$number的傳值是10,一個很小的數字。假設,現在傳遞一個值10000000(1000萬)。

那麼,在函數createRange裡面,for循環就需要執行1000萬次。且有1000萬個值被放到$data裡面,而$data陣列在是被放在記憶體內。所以,在呼叫函數時候會佔用大量記憶體。

這裡,生成器就可以大顯身手了。

建立生成器

我們直接修改程式碼,你們注意觀察:

function createRange($number){
    for($i=0;$i<$number;$i++){
        yield time();
    }
}

看下這段和剛剛很像的程式碼,我們刪除了陣列$ data,而且也沒有回傳任何內容,而是在time()之前使用了一個關鍵字yield

使用生成器

我們再運行第二段程式碼:

$result = createRange(10); // 这里调用上面我们创建的函数
foreach($result as $value){
    sleep(1);
    echo $value.&#39;<br />';
}

PHP中被忽略的效能最佳化利器:生成器

#我們奇蹟般的發現了,輸出的值和第一次沒有使用生成器的不一樣。這裡的值(時間戳記)中間間隔了1秒。

這裡的間隔一秒其實就是sleep(1)造成的後果。但為什麼第一次沒有間隔呢?那是因為:

  • 未使用生成器時:createRange函數內的for循環結果很快就會放到$在data中,並且立即傳回。所以,foreach循環的是一個固定的陣列。

  • 使用生成器時:createRange的值不是一次性快速生成,而是依賴foreach循環。 foreach迴圈一次,for執行一次。

到這裡,你應該對生成器有點兒頭緒。

深入理解生成器

程式碼剖析

下面我們來對於剛剛的程式碼進行剖析。

function createRange($number){
    for($i=0;$i<$number;$i++){
        yield time();
    }
}

$result = createRange(10); // 这里调用上面我们创建的函数
foreach($result as $value){
    sleep(1);
    echo $value.&#39;<br />';
}

我們來還原一下程式碼執行過程。

  1. 先呼叫createRange函數,傳入參數10,但for值執行了一次然後停止了,並且告訴foreach第一次迴圈可以用的值。

  2. foreach開始對$result循環,進來首先sleep(1),然後開始使用 for給的一個值執行輸出。

  3. foreach準備第二次循環,開始第二次循環之前,它向#​​##for循環又請求了一次。

  4. for循環於是又執行了一次,將產生的時間戳記告訴foreach.

  5. foreach拿到第二個值,並且輸出。由於foreachsleep(1),所以,for循環延遲了1秒產生目前時間

  6. ##所以,整個程式碼執行中,總是只有一個記錄值參與循環,記憶體中也只有一則訊息。

无论开始传入的$number有多大,由于并不会立即生成所有结果集,所以内存始终是一条循环的值。

概念理解

到这里,你应该已经大概理解什么是生成器了。下面我们来说下生成器原理。

首先明确一个概念:生成器yield关键字不是返回值,他的专业术语叫产出值,只是生成一个值

那么代码中foreach循环的是什么?其实是PHP在使用生成器的时候,会返回一个Generator类的对象。foreach可以对该对象进行迭代,每一次迭代,PHP会通过Generator实例计算出下一次需要迭代的值。这样foreach就知道下一次需要迭代的值了。

而且,在运行中for循环执行后,会立即停止。等待foreach下次循环时候再次和for索要下次的值的时候,for循环才会再执行一次,然后立即再次停止。直到不满足条件不执行结束。

实际开发应用

很多PHP开发者不了解生成器,其实主要是不了解应用领域。那么,生成器在实际开发中有哪些应用?

读取超大文件

PHP开发很多时候都要读取大文件,比如csv文件、text文件,或者一些日志文件。这些文件如果很大,比如5个G。这时,直接一次性把所有的内容读取到内存中计算不太现实。

这里生成器就可以派上用场啦。简单看个例子:读取text文件

PHP中被忽略的效能最佳化利器:生成器

我们创建一个text文本文档,并在其中输入几行文字,示范读取。

<?php
header("content-type:text/html;charset=utf-8");
function readTxt()
{
    # code...
    $handle = fopen("./test.txt", &#39;rb&#39;);

    while (feof($handle)===false) {
        # code...
        yield fgets($handle);
    }

    fclose($handle);
}

foreach (readTxt() as $key => $value) {
    # code...
    echo $value.'<br />';
}

PHP中被忽略的效能最佳化利器:生成器

通过上图的输出结果我们可以看出代码完全正常。

但是,背后的代码执行规则却一点儿也不一样。使用生成器读取文件,第一次读取了第一行,第二次读取了第二行,以此类推,每次被加载到内存中的文字只有一行,大大的减小了内存的使用。

这样,即使读取上G的文本也不用担心,完全可以像读取很小文件一样编写代码。

相关推荐:

php性能优化:isset()比strlen()更快

最全的php服务器性能优化配置方案

5个php7性能优化技巧总结

以上是PHP中被忽略的效能最佳化利器:生成器的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn