>백엔드 개발 >PHP 튜토리얼 >특정 차원의 URL에서 더 빠른 이미지 추출을 달성하는 방법은 무엇입니까?

특정 차원의 URL에서 더 빠른 이미지 추출을 달성하는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-10-26 04:02:28272검색

How to Achieve Faster Image Extraction from URLs with Specific Dimensions?

더 큰 크기의 URL에서 효율적으로 이미지 가져오기

이 질문의 목표는 크기가 200픽셀 이상인 이미지를 추출하는 프로세스를 최적화하는 것이었습니다. 주어진 URL의 너비와 높이. file_get_html() 및 getimagesize()를 사용한 초기 접근 방식에서는 실행 시간이 48.64초로 느렸습니다.

개선된 접근 방식:

효율성을 높이기 위해 다음 단계를 수행했습니다. 제안:

  1. 병렬 실행: 컬 요청의 병렬 실행을 위해 cur_multi_init를 사용하여 이미지 검색 속도를 높입니다.
  2. 로컬 이미지 저장소: 이미지를 로컬 디렉토리에 임시로 저장하여 원격 이미지 위치에서 getimagesize()를 수행하지 마세요.
  3. 이미지 변형 처리: 이미지 URL이 항상 "http"로 시작하지 않을 수도 있고 잘못된 형식이 포함되어 있을 수 있으며 이에 따라 해결할 수 있습니다.

샘플 코드:

<code class="php">require 'simple_html_dom.php';
$url = 'http://www.huffingtonpost.com';
$html = file_get_html ( $url );
$nodes = array ();
$start = microtime ();
$res = array ();

if ($html->find ( 'img' )) {
    foreach ( $html->find ( 'img' ) as $element ) {
        if (startsWith ( $element->src, "/" )) {
            $element->src = $url . $element->src;
        }
        if (! startsWith ( $element->src, "http" )) {
            $element->src = $url . "/" . $element->src;
        }
        $nodes [] = $element->src;
    }
}

echo "<pre class="brush:php;toolbar:false">";
print_r ( imageDownload ( $nodes, 200, 200 ) );
echo "<h1>", microtime () - $start, "</h1>";

function imageDownload($nodes, $maxHeight = 0, $maxWidth = 0) {

    $mh = curl_multi_init ();
    $curl_array = array ();
    foreach ( $nodes as $i => $url ) {
        $curl_array [$i] = curl_init ( $url );
        curl_setopt ( $curl_array [$i], CURLOPT_RETURNTRANSFER, true );
        curl_setopt ( $curl_array [$i], CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 (.NET CLR 3.5.30729)' );
        curl_setopt ( $curl_array [$i], CURLOPT_CONNECTTIMEOUT, 5 );
        curl_setopt ( $curl_array [$i], CURLOPT_TIMEOUT, 15 );
        curl_multi_add_handle ( $mh, $curl_array [$i] );
    }
    $running = NULL;
    do {
        usleep ( 10000 );
        curl_multi_exec ( $mh, $running );
    } while ( $running > 0 );

    $res = array ();
    foreach ( $nodes as $i => $url ) {
        $curlErrorCode = curl_errno ( $curl_array [$i] );

        if ($curlErrorCode === 0) {
            $info = curl_getinfo ( $curl_array [$i] );
            $ext = getExtention ( $info ['content_type'] );
            if ($info ['content_type'] !== null) {
                $temp = "temp/img" . md5 ( mt_rand () ) . $ext;
                touch ( $temp );
                $imageContent = curl_multi_getcontent ( $curl_array [$i] );
                file_put_contents ( $temp, $imageContent );
                if ($maxHeight == 0 || $maxWidth == 0) {
                    $res [] = $temp;
                } else {
                    $size = getimagesize ( $temp );
                    if ($size [1] >= $maxHeight &amp;&amp; $size [0] >= $maxWidth) {
                        $res [] = $temp;
                    } else {
                        unlink ( $temp );
                    }
                }
            }
        }
        curl_multi_remove_handle ( $mh, $curl_array [$i] );
        curl_close ( $curl_array [$i] );

    }

    curl_multi_close ( $mh );
    return $res;
}

function getExtention($type) {
    $type = strtolower ( $type );
    switch ($type) {
        case "image/gif" :
            return ".gif";
            break;
        case "image/png" :
            return ".png";
            break;

        case "image/jpeg" :
            return ".jpg";
            break;

        default :
            return ".img";
            break;
    }
}

function startsWith($str, $prefix) {
    $temp = substr ( $str, 0, strlen ( $prefix ) );
    $temp = strtolower ( $temp );
    $prefix = strtolower ( $prefix );
    return ($temp == $prefix);
}</code>

이 업데이트된 접근 방식은 상당한 속도 향상을 보여주었으며, 단 몇 시간 만에 이미지를 검색했습니다. 기존 48.64초 대비 0.076초.

위 내용은 특정 차원의 URL에서 더 빠른 이미지 추출을 달성하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.