>  기사  >  백엔드 개발  >  PHP에서 간과된 성능 최적화 도구: 생성기

PHP에서 간과된 성능 최적화 도구: 생성기

小云云
小云云원래의
2017-12-08 13:58:161281검색

이 기사에서는 PHP에서 간과되는 성능 최적화 도구인 생성기에 대한 지식을 공유하겠습니다. Python이나 다른 언어로 작업하는 경우 생성기에 익숙해야 합니다. 하지만 많은 PHP 개발자들이 제너레이터 기능을 모르고 있을 수도 있습니다. 제너레이터가 PHP 5.5.0에서 도입된 기능이거나, 제너레이터의 기능이 그다지 명확하지 않기 때문일 수도 있습니다. 그러나 생성기 기능은 정말 유용합니다.

장점

콘셉트에 대해 직접 이야기하면 듣고 나서도 헷갈릴 것 같아서 장점부터 먼저 얘기해 보면 흥미를 불러일으킬 수도 있을 것 같아요. 따라서 생성기의 장점은 다음과 같습니다.

  • Generator는 PHP 애플리케이션의 성능에 큰 영향을 미칩니다.

  • PHP 코드가 실행될 때 많은 메모리를 절약합니다.

  • 다음과 같은 용도에 더 적합합니다. 대량의 데이터를 계산하는 중

그렇다면 이러한 마법의 기능은 어떻게 구현되는 걸까요? 먼저 예를 들어 보겠습니다.

개념 소개

먼저 생성기 개념에 대한 부담을 내려놓고 간단한 PHP 함수를 살펴보겠습니다.

function createRange($number){
    $data = [];
    for($i=0;$i<$number;$i++){
        $data[] = time();
    }
    return $data;
}

이것은 우리가 일부 배열을 처리할 때 자주 사용하는 매우 일반적인 PHP 함수입니다. 여기에 있는 코드도 매우 간단합니다.

  1. 함수를 만듭니다.

  2. 함수에는 for 루프가 포함되어 있습니다. 현재 시간을 $datafor循环,我们循环的把当前时间放到$data里面

  3. for循环执行完毕,把$data返回出去。

下面没完,我们继续。我们再写一个函数,把这个函数的返回值循环打印出来:

$result = createRange(10); // 这里调用上面我们创建的函数
foreach($result as $value){
    sleep(1);//这里停顿1秒,我们后续有用
    echo $value.&#39;<br />';
}

我们在浏览器里面看一下运行结果:

PHP에서 간과된 성능 최적화 도구: 생성기

这里非常完美,没有任何问题。(当然sleep(1)效果你们看不出来)

思考一个问题

我们注意到,在调用函数createRange的时候给$number的传值是10,一个很小的数字。假设,现在传递一个值10000000(1000万)。

那么,在函数createRange里面,for循环就需要执行1000万次。且有1000万个值被放到$data里面,而$data数组在是被放在内存内。所以,在调用函数时候会占用大量内存。

这里,生成器就可以大显身手了。

创建生成器

我们直接修改代码,你们注意观察:

function createRange($number){
    for($i=0;$i<$number;$i++){
        yield time();
    }
}

看下这段和刚刚很像的代码,我们删除了数组$data,而且也没有返回任何内容,而是在time()之前使用了一个关键字yield

使用生成器

我们再运行一下第二段代码:

$result = createRange(10); // 这里调用上面我们创建的函数
foreach($result as $value){
    sleep(1);
    echo $value.&#39;<br />';
}

PHP에서 간과된 성능 최적화 도구: 생성기

我们奇迹般的发现了,输出的值和第一次没有使用生成器的不一样。这里的值(时间戳)中间间隔了1秒。

这里的间隔一秒其实就是sleep(1)造成的后果。但是为什么第一次没有间隔?那是因为:

  • 未使用生成器时:createRange函数内的for循环结果被很快放到$data中,并且立即返回。所以,foreach循环的是一个固定的数组。

  • 使用生成器时:createRange的值不是一次性快速生成,而是依赖于foreach循环。foreach循环一次,for执行一次。

到这里,你应该对生成器有点儿头绪。

深入理解生成器

代码剖析

下面我们来对于刚刚的代码进行剖析。

function createRange($number){
    for($i=0;$i<$number;$i++){
        yield time();
    }
}

$result = createRange(10); // 这里调用上面我们创建的函数
foreach($result as $value){
    sleep(1);
    echo $value.&#39;<br />';
}

我们来还原一下代码执行过程。

  1. 首先调用createRange函数,传入参数10,但是for值执行了一次然后停止了,并且告诉foreach第一次循环可以用的值。

  2. foreach开始对$result循环,进来首先sleep(1),然后开始使用for给的一个值执行输出。

  3. foreach准备第二次循环,开始第二次循环之前,它向for循环又请求了一次。

  4. for循环于是又执行了一次,将生成的时间戳告诉foreach.

  5. foreach拿到第二个值,并且输出。由于foreachsleep(1),所以,for

for 루프 실행으로 반복합니다. $data를 반환합니다.

🎜🎜아직 끝나지 않았으니 계속하자. 다른 함수를 작성하고 루프에서 이 함수의 반환 값을 인쇄해 보겠습니다. 🎜
<?php
header("content-type:text/html;charset=utf-8");
function readTxt()
{
    # code...
    $handle = fopen("./test.txt", &#39;rb&#39;);

    while (feof($handle)===false) {
        # code...
        yield fgets($handle);
    }

    fclose($handle);
}

foreach (readTxt() as $key => $value) {
    # code...
    echo $value.'<br />';
}
🎜 브라우저에서 실행 결과를 살펴보겠습니다. 🎜🎜PHP에서 간과된 성능 최적화 도구: 생성기🎜🎜이건 완벽하고 문제가 없습니다. (물론 sleep(1)의 효과를 볼 수는 없습니다.) 🎜🎜질문에 대해 생각해 보세요🎜🎜우리는 createRange 함수를 호출할 때 >$number에 전달된 값은 10으로 매우 작은 숫자입니다. 이제 <code>10000000(천만) 값을 전달한다고 가정해 보겠습니다. 🎜🎜그런 다음 createRange 함수에서 for 루프를 1000번 실행해야 합니다. 그리고 $data에는 1000 1만 개의 값이 있고, $data 배열이 메모리에 배치됩니다. 따라서 함수를 호출할 때 많은 메모리를 차지하게 됩니다. 🎜🎜여기서 발전기가 작동할 수 있습니다. 🎜🎜생성기 만들기🎜🎜코드를 직접 수정하니 주의하세요. 🎜rrreee🎜이 코드를 보세요. 방금 것과 매우 유사합니다. $data 배열을 삭제했지만 삭제하지 않았습니다. 무엇이든 반환합니다. 대신 time()🎜🎜생성기를 사용하세요🎜🎜 두 번째 코드 조각을 다시 실행해 보겠습니다.🎜rrreee🎜PHP에서 간과된 성능 최적화 도구: 생성기🎜🎜우리는 기적적으로 그것을 발견했습니다 생성기를 사용하지 않았을 때 출력값이 처음과 다릅니다. 여기의 값(타임스탬프)은 1초 단위로 구분됩니다. 🎜🎜여기서 1초 간격은 실제로 sleep(1)의 결과입니다. 그런데 왜 처음에는 공백이 없나요? 그 이유는 다음과 같습니다. 🎜🎜🎜🎜생성기가 사용되지 않는 경우: createRange 함수의 for 루프 결과가 $data에 빠르게 배치됩니다. > , 즉시 반환됩니다. 따라서 foreach는 고정 배열을 반복합니다. 🎜🎜🎜🎜생성기를 사용하는 경우: createRange 값은 한 번에 빠르게 생성되지 않고 foreach 루프에 의존합니다. foreach는 한 번 반복되고 for는 한 번 실행됩니다. 🎜🎜🎜🎜이 시점에서는 발전기에 대해 어느 정도 알고 있어야 합니다. 🎜🎜제너레이터 심층 이해🎜

코드 분석

🎜지금 바로 코드를 분석해 보겠습니다. 🎜rrreee🎜코드 실행 프로세스를 복원해 보겠습니다. 🎜🎜🎜🎜먼저 createRange 함수를 호출하여 10 매개변수를 전달하는데 for 값이 한 번 실행된 다음 중지되고, foreach첫 번째 루프에서 사용할 수 있는 값입니다. 🎜🎜🎜🎜foreach$result를 반복하기 시작하고 먼저 sleep(1)로 들어온 다음 for를 사용하기 시작합니다. code> 주어진 값으로 출력을 실행합니다. 🎜🎜🎜🎜foreach는 두 번째 루프를 시작하기 전에 for 루프를 다시 요청합니다. 🎜🎜🎜🎜 for 루프가 다시 실행되고 생성된 타임스탬프에 foreach가 전달됩니다.🎜🎜🎜🎜foreach가 두 번째 값을 얻습니다. 그리고 출력. foreachsleep(1) 이후 for 루프는 현재 시간을 생성하기 위해 1초 지연됩니다🎜🎜🎜🎜그래서 전체 코드가 실행 중이면 루프에 항상 하나의 레코드 값만 참여하고 메모리에는 하나의 정보만 있습니다. 🎜

无论开始传入的$number有多大,由于并不会立即生成所有结果集,所以内存始终是一条循环的值。

概念理解

到这里,你应该已经大概理解什么是生成器了。下面我们来说下生成器原理。

首先明确一个概念:生成器yield关键字不是返回值,他的专业术语叫产出值,只是生成一个值

那么代码中foreach循环的是什么?其实是PHP在使用生成器的时候,会返回一个Generator类的对象。foreach可以对该对象进行迭代,每一次迭代,PHP会通过Generator实例计算出下一次需要迭代的值。这样foreach就知道下一次需要迭代的值了。

而且,在运行中for循环执行后,会立即停止。等待foreach下次循环时候再次和for索要下次的值的时候,for循环才会再执行一次,然后立即再次停止。直到不满足条件不执行结束。

实际开发应用

很多PHP开发者不了解生成器,其实主要是不了解应用领域。那么,生成器在实际开发中有哪些应用?

读取超大文件

PHP开发很多时候都要读取大文件,比如csv文件、text文件,或者一些日志文件。这些文件如果很大,比如5个G。这时,直接一次性把所有的内容读取到内存中计算不太现实。

这里生成器就可以派上用场啦。简单看个例子:读取text文件

PHP에서 간과된 성능 최적화 도구: 생성기

我们创建一个text文本文档,并在其中输入几行文字,示范读取。

<?php
header("content-type:text/html;charset=utf-8");
function readTxt()
{
    # code...
    $handle = fopen("./test.txt", &#39;rb&#39;);

    while (feof($handle)===false) {
        # code...
        yield fgets($handle);
    }

    fclose($handle);
}

foreach (readTxt() as $key => $value) {
    # code...
    echo $value.'<br />';
}

PHP에서 간과된 성능 최적화 도구: 생성기

通过上图的输出结果我们可以看出代码完全正常。

但是,背后的代码执行规则却一点儿也不一样。使用生成器读取文件,第一次读取了第一行,第二次读取了第二行,以此类推,每次被加载到内存中的文字只有一行,大大的减小了内存的使用。

这样,即使读取上G的文本也不用担心,完全可以像读取很小文件一样编写代码。

相关推荐:

php性能优化:isset()比strlen()更快

最全的php服务器性能优化配置方案

5个php7性能优化技巧总结

위 내용은 PHP에서 간과된 성능 최적화 도구: 생성기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.