如果您是做Python或其他語言的小夥伴,您應該熟悉生成器。然而,許多PHP開發人員可能不知道生成器的功能,要么是因為生成器是在PHP 5.5.0中引入的,要么是因為生成器的功能不明顯。但是生成器功能確實非常有用。
優點
直接講概念估計你聽完還是一頭霧水,所以我們先來說說優點,也許能勾起你的興趣。那麼生成器有哪些優點,如下:
● 產生器會對PHP應用的效能有非常大的影響
● PHP程式碼執行時節省大量的記憶體
● 比較適合計算大量的資料
那麼,這些神奇的功能究竟是如何做到的呢?我們先來舉個例子。
概念引入
首先,放下生成器概念的包袱,來看一個簡單的PHP函數:
function createRange($number){ $data = []; for($i=0;$i<$number;$i++){ $data[] = time(); } return $data; }
這是一個非常常見的PHP函數,我們在處理一些陣列的時候常常會使用。這裡的程式碼也非常簡單:
1.我們建立一個函數。
2.函數內包含一個for循環,我們循環的把當前時間放到$data裡面
#3.for迴圈執行完畢,把$data回傳。
下面沒完,我們繼續。我們再寫一個函數,把這個函數的回傳值循環印出來:
$result = createRange(10); // 这里调用上面我们创建的函数 foreach($result as $value){ sleep(1);//这里停顿1秒,我们后续有用 echo $value.'<br />'; }
我們在瀏覽器裡面看一下運行結果:
##這裡非常完美,沒有任何問題。 (當然sleep(1)效果你們看不出來)思考一個問題
#我們注意到,在呼叫函數createRange的時候給$number的傳值是10,一個很小的數字。假設,現在傳遞一個值10000000(1000萬)。 那麼,在函數createRange裡面,for迴圈就需要執行1000萬次。且有1000萬個值被放到$data裡面,而$data數組在是被放在記憶體內。所以,在呼叫函數時候會佔用大量記憶體。 這裡,生成器就可以大顯身手了。建立生成器
我們直接修改程式碼,你們注意觀察:function createRange($number){ for($i=0;$i<$number;$i++){ yield time(); } }看下這段和剛剛很像的程式碼,我們刪除了數組$data,也沒有回傳任何內容,而是在time()之前使用了一個關鍵字yield
使用生成器##我們再運行一下第二段程式碼:
$result = createRange(10); // 这里调用上面我们创建的函数 foreach($result as $value){ sleep(1); echo $value.'<br />'; }
我們奇蹟般的發現了,輸出的值和第一次沒有使用生成器的不一樣。這裡的值(時間戳記)中間間隔了1秒。
這裡的間隔一秒鐘其實就是sleep(1)造成的後果。但為什麼第一次沒有間隔呢?那是因為:
● 未使用生成器時:createRange函數內的for循環結果很快就會放到$data中,並且立即回傳。所以,foreach循環的是一個固定的陣列。
● 使用生成器時:createRange的值不是一次性快速生成,而是依賴foreach循環。 foreach迴圈一次,for執行一次。
到這裡,你應該對生成器有點頭緒。
可以深入理解生成器程式碼剖析
#下面我們來對剛剛的程式碼進行剖析。
function createRange($number){ for($i=0;$i<$number;$i++){ yield time(); } } $result = createRange(10); // 这里调用上面我们创建的函数 foreach($result as $value){ sleep(1); echo $value.'<br />'; }
我們來還原一下程式碼執行過程。
1.首先呼叫createRange函數,傳入參數10,但是for值執行了一次然後停止了,並且告訴foreach第一次循環可以用的值。
2.foreach開始對$result循環,進來首先sleep(1),然後開始使用for給的一個值執行輸出。
3.foreach準備第二次循環,在開始第二次循環之前,它又向for循環請求了一次。
4.for迴圈於是又執行了一次,將生成的時間戳記告訴foreach.
#5.foreach拿到第二個值,並且輸出。由於foreach中sleep(1),所以,for循環延遲了1秒生成當前時間
所以,整個程式碼執行中,總是只有一個記錄值參與循環,記憶體中也只有一條訊息。
無論開始傳入的$number有多大,由於不會立即產生所有結果集,所以記憶體總是一條循環的值。
概念理解到這裡,你應該已經大概理解什麼是生成器了。下面我們來說下生成器原理。
首先明確一個概念:生成器yield關鍵字不是回傳值,他的專業術語叫產出值,只是產生一個值
那麼程式碼中foreach循環的是什麼?其實是PHP使用生成器的時候,會回傳一個Generator類別的物件。 foreach可以對該物件進行迭代,每一次迭代,PHP會透過Generator實例計算下一次需要迭代的值。這樣foreach就知道下一次需要迭代的值了。
而且,在运行中for循环执行后,会立即停止。等待foreach下次循环时候再次和for索要下次的值的时候,for循环才会再执行一次,然后立即再次停止。直到不满足条件不执行结束。
实际开发应用
很多PHP开发者不了解生成器,其实主要是不了解应用领域。那么,生成器在实际开发中有哪些应用?
读取超大文件
PHP开发很多时候都要读取大文件,比如csv文件、text文件,或者一些日志文件。这些文件如果很大,比如5个G。这时,直接一次性把所有的内容读取到内存中计算不太现实。
这里生成器就可以派上用场啦。简单看个例子:读取text文件
我们创建一个text文本文档,并在其中输入几行文字,示范读取。
<?php header("content-type:text/html;charset=utf-8"); function readTxt() { # code... $handle = fopen("./test.txt", 'rb'); while (feof($handle)===false) { # code... yield fgets($handle); } fclose($handle); } foreach (readTxt() as $key => $value) { # code... echo $value.'<br />'; }
通过上图的输出结果我们可以看出代码完全正常。
但是,背后的代码执行规则却一点儿也不一样。使用生成器读取文件,第一次读取了第一行,第二次读取了第二行,以此类推,每次被加载到内存中的文字只有一行,大大的减小了内存的使用。
这样,即使读取上G的文本也不用担心,完全可以像读取很小文件一样编写代码。
批量更新数据库表字段
/** * @desc: 方法描述 * @param int $count 数组个数(需要循环多少次) * @param int $limit 数组大小 * @return \Generator */ public function getAddressContent($count = 1, $limit = 20000) { for ($i = 0; $i < ceil($count / $limit); $i++) { $result = StudentModel::where('id','<','67265') ->limit($i * $limit, $limit) ->order('id desc') ->select()->toArray(); yield $result; } } /** * @desc: 修改数据库 省份、城市 * @throws Exception */ public function idCard() { $count = 200000000; // 需要更新的数据 foreach ($this->getAddressContent($count) as $key=>$lists) { foreach ($lists as $k => $v) { $peopleIdentity = new Identity($v['idcard']); $peopleRegion = $peopleIdentity->region(); if($peopleRegion->code() != 0 ){ $res = StudentModel::where('id', $v['id'])->update([ 'birthday' => $peopleIdentity->birthday()??'', 'province' => $peopleRegion->province()??'', 'city' => $peopleRegion->city()??'', 'county' => $peopleRegion->county()??'', ]); Log::debug('更新结果 [' . $v['id'] . ']: ' . json_encode($res)); } } } echo "success"; }
使用命令行执行
php id_card.php
打印日志
CPU和内存消耗
更多php知识,请访问php教程!
以上是PHP效能最佳化利器:生成器的詳細內容。更多資訊請關注PHP中文網其他相關文章!