首页  >  文章  >  后端开发  >  ## 如何高效地从具有维度阈值的 URL 中获取图像?

## 如何高效地从具有维度阈值的 URL 中获取图像?

Linda Hamilton
Linda Hamilton原创
2024-10-27 05:40:29296浏览

## How to Efficiently Fetch Images from URLs with Dimension Thresholds?

高效地从具有宽度和高度阈值的 URL 获取图像

问题:

检索图像从给定的 URL 获取满足特定宽度和高度要求的数据(例如尺寸均大于或等于 200 像素的图像)是 Web 开发中的一项常见任务。但是,使用传统方法,此过程可能非常耗时。

当前方法:

提供的代码迭代所有 ## 如何高效地从具有维度阈值的 URL 中获取图像? 。给定 URL 上的元素,使用 getimagesize() 检索图像尺寸。虽然这种方法有效,但其执行时间可能会很明显。

建议的解决方案:

要加快进程,请考虑以下优化:

  • 并行图像下载:利用curl_multi_init函数并行下载图像。此技术通过同时启动多个请求来减少总体获取时间。
  • 本地文件存储:不要直接在来自 HTTP URL 的图像上运行 getimagesize(),而是在本地下载它们并将它们存储在临时文件夹。这避免了维度检索的 HTTP 请求的开销。

代码实现:

以下代码提供了包含这些优化的更高效的实现:

<code class="php">require 'simple_html_dom.php';
$url = 'http://www.huffingtonpost.com';
$html = file_get_html($url);
$nodes = array();
$start = microtime();
$res = array();

if ($html->find('img')) {
    foreach ($html->find('img') as $element) {
        if (startsWith($element->src, "/")) {
            $element->src = $url . $element->src;
        }
        if (!startsWith($element->src, "http")) {
            $element->src = $url . "/" . $element->src;
        }
        $nodes[] = $element->src;
    }
}

echo "<pre class="brush:php;toolbar:false">";
print_r(imageDownload($nodes, 200, 200));
echo "<h1>", microtime() - $start, "</h1>";

function imageDownload($nodes, $maxHeight = 0, $maxWidth = 0) {
    $mh = curl_multi_init();
    $curl_array = array();
    foreach ($nodes as $i => $url) {
        $curl_array[$i] = curl_init($url);
        curl_setopt($curl_array[$i], CURLOPT_RETURNTRANSFER, true);
        curl_setopt($curl_array[$i], CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 (.NET CLR 3.5.30729)');
        curl_setopt($curl_array[$i], CURLOPT_CONNECTTIMEOUT, 5);
        curl_setopt($curl_array[$i], CURLOPT_TIMEOUT, 15);
        curl_multi_add_handle($mh, $curl_array[$i]);
    }
    $running = NULL;
    do {
        usleep(10000);
        curl_multi_exec($mh, $running);
    } while ($running > 0);

    $res = array();
    foreach ($nodes as $i => $url) {
        $curlErrorCode = curl_errno($curl_array[$i]);

        if ($curlErrorCode === 0) {
            $info = curl_getinfo($curl_array[$i]);
            $ext = getExtention($info['content_type']);
            if ($info['content_type'] !== null) {
                $temp = "temp/img" . md5(mt_rand()) . $ext;
                touch($temp);
                $imageContent = curl_multi_getcontent($curl_array[$i]);
                file_put_contents($temp, $imageContent);
                if ($maxHeight == 0 || $maxWidth == 0) {
                    $res[] = $temp;
                } else {
                    $size = getimagesize($temp);
                    if ($size[1] >= $maxHeight && $size[0] >= $maxWidth) {
                        $res[] = $temp;
                    } else {
                        unlink($temp);
                    }
                }
            }
        }
        curl_multi_remove_handle($mh, $curl_array[$i]);
        curl_close($curl_array[$i]);

    }

    curl_multi_close($mh);
    return $res;
}

function getExtention($type) {
    $type = strtolower($type);
    switch ($type) {
        case "image/gif":
            return ".gif";
            break;
        case "image/png":
            return ".png";
            break;

        case "image/jpeg":
            return ".jpg";
            break;

        default:
            return ".img";
            break;
    }
}

function startsWith($str, $prefix) {
    $temp = substr($str, 0, strlen($prefix));
    $temp = strtolower($temp);
    $prefix = strtolower($prefix);
    return ($temp == $prefix);
}</code>

优点:

  • 与原始方法相比,优化的代码显着减少了获取时间。
  • 它使用curl_multi_init 进行并行下载,提高效率。
  • 本地文件存储策略避免了重复的 HTTP 请求维度检索,从而节省了时间。

以上是## 如何高效地从具有维度阈值的 URL 中获取图像?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn