이 기사에서는 PHP에서 간과되는 성능 최적화 도구인 생성기에 대한 지식을 공유하겠습니다. Python이나 다른 언어로 작업하는 경우 생성기에 익숙해야 합니다. 하지만 많은 PHP 개발자들이 제너레이터 기능을 모르고 있을 수도 있습니다. 제너레이터가 PHP 5.5.0에서 도입된 기능이거나, 제너레이터의 기능이 그다지 명확하지 않기 때문일 수도 있습니다. 그러나 생성기 기능은 정말 유용합니다.
콘셉트에 대해 직접 이야기하면 듣고 나서도 헷갈릴 것 같아서 장점부터 먼저 얘기해 보면 흥미를 불러일으킬 수도 있을 것 같아요. 따라서 생성기의 장점은 다음과 같습니다.
Generator는 PHP 애플리케이션의 성능에 큰 영향을 미칩니다.
PHP 코드가 실행될 때 많은 메모리를 절약합니다.
다음과 같은 용도에 더 적합합니다. 대량의 데이터를 계산하는 중
그렇다면 이러한 마법의 기능은 어떻게 구현되는 걸까요? 먼저 예를 들어 보겠습니다.
먼저 생성기 개념에 대한 부담을 내려놓고 간단한 PHP 함수를 살펴보겠습니다.
function createRange($number){ $data = []; for($i=0;$i<$number;$i++){ $data[] = time(); } return $data; }
이것은 우리가 일부 배열을 처리할 때 자주 사용하는 매우 일반적인 PHP 함수입니다. 여기에 있는 코드도 매우 간단합니다.
함수를 만듭니다.
함수에는 for
루프가 포함되어 있습니다. 현재 시간을 $data
for
循环,我们循环的把当前时间放到$data
里面
for
循环执行完毕,把$data
返回出去。
下面没完,我们继续。我们再写一个函数,把这个函数的返回值循环打印出来:
$result = createRange(10); // 这里调用上面我们创建的函数 foreach($result as $value){ sleep(1);//这里停顿1秒,我们后续有用 echo $value.'<br />'; }
我们在浏览器里面看一下运行结果:
这里非常完美,没有任何问题。(当然sleep(1)
效果你们看不出来)
我们注意到,在调用函数createRange
的时候给$number
的传值是10,一个很小的数字。假设,现在传递一个值10000000
(1000万)。
那么,在函数createRange
里面,for
循环就需要执行1000
万次。且有1000
万个值被放到$data
里面,而$data
数组在是被放在内存内。所以,在调用函数时候会占用大量内存。
这里,生成器就可以大显身手了。
我们直接修改代码,你们注意观察:
function createRange($number){ for($i=0;$i<$number;$i++){ yield time(); } }
看下这段和刚刚很像的代码,我们删除了数组$data
,而且也没有返回任何内容,而是在time()
之前使用了一个关键字yield
我们再运行一下第二段代码:
$result = createRange(10); // 这里调用上面我们创建的函数 foreach($result as $value){ sleep(1); echo $value.'<br />'; }
我们奇迹般的发现了,输出的值和第一次没有使用生成器的不一样。这里的值(时间戳)中间间隔了1秒。
这里的间隔一秒其实就是sleep(1)
造成的后果。但是为什么第一次没有间隔?那是因为:
未使用生成器时:createRange
函数内的for
循环结果被很快放到$data
中,并且立即返回。所以,foreach
循环的是一个固定的数组。
使用生成器时:createRange
的值不是一次性快速生成,而是依赖于foreach
循环。foreach
循环一次,for
执行一次。
到这里,你应该对生成器有点儿头绪。
下面我们来对于刚刚的代码进行剖析。
function createRange($number){ for($i=0;$i<$number;$i++){ yield time(); } } $result = createRange(10); // 这里调用上面我们创建的函数 foreach($result as $value){ sleep(1); echo $value.'<br />'; }
我们来还原一下代码执行过程。
首先调用createRange
函数,传入参数10
,但是for
值执行了一次然后停止了,并且告诉foreach
第一次循环可以用的值。
foreach
开始对$result
循环,进来首先sleep(1)
,然后开始使用for
给的一个值执行输出。
foreach
准备第二次循环,开始第二次循环之前,它向for
循环又请求了一次。
for
循环于是又执行了一次,将生成的时间戳告诉foreach
.
foreach
拿到第二个值,并且输出。由于foreach
中sleep(1)
,所以,for
for
루프 실행으로 반복합니다. $data
를 반환합니다. 🎜🎜아직 끝나지 않았으니 계속하자. 다른 함수를 작성하고 루프에서 이 함수의 반환 값을 인쇄해 보겠습니다. 🎜<?php header("content-type:text/html;charset=utf-8"); function readTxt() { # code... $handle = fopen("./test.txt", 'rb'); while (feof($handle)===false) { # code... yield fgets($handle); } fclose($handle); } foreach (readTxt() as $key => $value) { # code... echo $value.'<br />'; }🎜 브라우저에서 실행 결과를 살펴보겠습니다. 🎜🎜🎜🎜이건 완벽하고 문제가 없습니다. (물론
sleep(1)
의 효과를 볼 수는 없습니다.) 🎜🎜질문에 대해 생각해 보세요🎜🎜우리는 createRange
함수를 호출할 때 >$number에 전달된 값은 10으로 매우 작은 숫자입니다. 이제 <code>10000000
(천만) 값을 전달한다고 가정해 보겠습니다. 🎜🎜그런 다음 createRange
함수에서 for
루프를 1000
번 실행해야 합니다. 그리고 $data
에는 1000
1만 개의 값이 있고, $data
배열이 메모리에 배치됩니다. 따라서 함수를 호출할 때 많은 메모리를 차지하게 됩니다. 🎜🎜여기서 발전기가 작동할 수 있습니다. 🎜🎜생성기 만들기🎜🎜코드를 직접 수정하니 주의하세요. 🎜rrreee🎜이 코드를 보세요. 방금 것과 매우 유사합니다. $data
배열을 삭제했지만 삭제하지 않았습니다. 무엇이든 반환합니다. 대신 time()
🎜🎜생성기를 사용하세요🎜🎜 두 번째 코드 조각을 다시 실행해 보겠습니다.🎜rrreee🎜🎜🎜우리는 기적적으로 그것을 발견했습니다 생성기를 사용하지 않았을 때 출력값이 처음과 다릅니다. 여기의 값(타임스탬프)은 1초 단위로 구분됩니다. 🎜🎜여기서 1초 간격은 실제로 sleep(1)
의 결과입니다. 그런데 왜 처음에는 공백이 없나요? 그 이유는 다음과 같습니다. 🎜🎜🎜🎜생성기가 사용되지 않는 경우: createRange
함수의 for
루프 결과가 $data
에 빠르게 배치됩니다. > , 즉시 반환됩니다. 따라서 foreach
는 고정 배열을 반복합니다. 🎜🎜🎜🎜생성기를 사용하는 경우: createRange
값은 한 번에 빠르게 생성되지 않고 foreach
루프에 의존합니다. foreach
는 한 번 반복되고 for
는 한 번 실행됩니다. 🎜🎜🎜🎜이 시점에서는 발전기에 대해 어느 정도 알고 있어야 합니다. 🎜🎜제너레이터 심층 이해🎜createRange
함수를 호출하여 10
매개변수를 전달하는데 for
값이 한 번 실행된 다음 중지되고, foreach
첫 번째 루프에서 사용할 수 있는 값입니다. 🎜🎜🎜🎜foreach
는 $result
를 반복하기 시작하고 먼저 sleep(1)
로 들어온 다음 for
를 사용하기 시작합니다. code> 주어진 값으로 출력을 실행합니다. 🎜🎜🎜🎜foreach
는 두 번째 루프를 시작하기 전에 for
루프를 다시 요청합니다. 🎜🎜🎜🎜 for
루프가 다시 실행되고 생성된 타임스탬프에 foreach
가 전달됩니다.🎜🎜🎜🎜foreach
가 두 번째 값을 얻습니다. 그리고 출력. foreach
의 sleep(1)
이후 for
루프는 현재 시간을 생성하기 위해 1초 지연됩니다🎜🎜🎜🎜그래서 전체 코드가 실행 중이면 루프에 항상 하나의 레코드 값만 참여하고 메모리에는 하나의 정보만 있습니다. 🎜无论开始传入的$number
有多大,由于并不会立即生成所有结果集,所以内存始终是一条循环的值。
到这里,你应该已经大概理解什么是生成器了。下面我们来说下生成器原理。
首先明确一个概念:生成器yield关键字不是返回值,他的专业术语叫产出值,只是生成一个值
那么代码中foreach
循环的是什么?其实是PHP在使用生成器的时候,会返回一个Generator
类的对象。foreach
可以对该对象进行迭代,每一次迭代,PHP会通过Generator
实例计算出下一次需要迭代的值。这样foreach
就知道下一次需要迭代的值了。
而且,在运行中for
循环执行后,会立即停止。等待foreach
下次循环时候再次和for
索要下次的值的时候,for
循环才会再执行一次,然后立即再次停止。直到不满足条件不执行结束。
很多PHP开发者不了解生成器,其实主要是不了解应用领域。那么,生成器在实际开发中有哪些应用?
PHP开发很多时候都要读取大文件,比如csv文件、text文件,或者一些日志文件。这些文件如果很大,比如5个G。这时,直接一次性把所有的内容读取到内存中计算不太现实。
这里生成器就可以派上用场啦。简单看个例子:读取text文件
我们创建一个text文本文档,并在其中输入几行文字,示范读取。
<?php header("content-type:text/html;charset=utf-8"); function readTxt() { # code... $handle = fopen("./test.txt", 'rb'); while (feof($handle)===false) { # code... yield fgets($handle); } fclose($handle); } foreach (readTxt() as $key => $value) { # code... echo $value.'<br />'; }
通过上图的输出结果我们可以看出代码完全正常。
但是,背后的代码执行规则却一点儿也不一样。使用生成器读取文件,第一次读取了第一行,第二次读取了第二行,以此类推,每次被加载到内存中的文字只有一行,大大的减小了内存的使用。
这样,即使读取上G的文本也不用担心,完全可以像读取很小文件一样编写代码。
相关推荐:
위 내용은 PHP에서 간과된 성능 최적화 도구: 생성기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!