찾다
백엔드 개발PHP 튜토리얼PHP에서 동시 요청을 구현하는 방법(코드)
PHP에서 동시 요청을 구현하는 방법(코드)Sep 11, 2018 pm 03:08 PM
curlphp경쟁 상대웹 크롤러묻다

이 글의 내용은 PHP에서 동시 요청(코드)을 구현하는 방법에 대한 내용입니다. 필요한 친구들이 참고할 수 있기를 바랍니다.

백엔드 서비스 개발에는 동시 요청에 대한 요구 사항이 있는 경우가 많습니다. 예를 들어 10개 공급업체(각각 다른 url 제공)의 대역폭 데이터를 얻은 다음 통합 데이터를 반환해야 합니다. , 당신은 무엇을 하시겠습니까? url),然后返回一个整合后的数据,你会怎么做呢?

PHP中,最直观的做法foreach遍历urls,并保存每个请求的结果即可,那么如果供应商提供的接口平均耗时5s,你的这个接口请求耗时就达到了50s,这对于追求速度和性能的网站来说是不可接受的。

这个时候你就需要并发请求了。

PHP请求

PHP是单进程同步模型,一个请求对应一个进程,I/O是同步阻塞的。通过nginx/apache/php-fpm等服务的扩展,才使得PHP提供高并发的服务,原理就是维护一个进程池,每个请求服务时单独起一个新的进程,每个进程独立存在。

PHP不支持多线程模式和回调处理,因此PHP内部脚本都是同步阻塞式的,如果你发起一个5s的请求,那么程序就会I/O阻塞5s,直到请求返回结果,才会继续执行代码。因此做爬虫之类的高并发请求需求很吃力。

那怎么来解决并发请求的问题呢?除了内置的file_get_contentsfsockopen请求方式,PHP也支持cURL扩展来发起请求,它支持常规的单个请求:PHP cURL请求详解,也支持并发请求,其并发原理是cURL扩展使用多线程来管理多请求。

PHP并发请求

我们直接来看代码demo:

// 简单demo,默认支持为GET请求
public function multiRequest($urls) {
    $mh = curl_multi_init();
    $urlHandlers = [];
    $urlData = [];
    // 初始化多个请求句柄为一个
    foreach($urls as $value) {
        $ch = curl_init();
        $url = $value['url'];
        $url .= strpos($url, '?') ? '&' : '?';
        $params = $value['params'];
        $url .= is_array($params) ? http_build_query($params) : $params;
        curl_setopt($ch, CURLOPT_URL, $url);
        // 设置数据通过字符串返回,而不是直接输出
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
        $urlHandlers[] = $ch;
        curl_multi_add_handle($mh, $ch);
    }
    $active = null;
    // 检测操作的初始状态是否OK,CURLM_CALL_MULTI_PERFORM为常量值-1
    do {
        // 返回的$active是活跃连接的数量,$mrc是返回值,正常为0,异常为-1
        $mrc = curl_multi_exec($mh, $active);
    } while ($mrc == CURLM_CALL_MULTI_PERFORM);
    // 如果还有活动的请求,同时操作状态OK,CURLM_OK为常量值0
    while ($active && $mrc == CURLM_OK) {
        // 持续查询状态并不利于处理任务,每50ms检查一次,此时释放CPU,降低机器负载
        usleep(50000);
        // 如果批处理句柄OK,重复检查操作状态直至OK。select返回值异常时为-1,正常为1(因为只有1个批处理句柄)
        if (curl_multi_select($mh) != -1) {
            do {
                $mrc = curl_multi_exec($mh, $active);
            } while ($mrc == CURLM_CALL_MULTI_PERFORM);
        }
    }
    // 获取返回结果
    foreach($urlHandlers as $index => $ch) {
        $urlData[$index] = curl_multi_getcontent($ch);
        // 移除单个curl句柄
        curl_multi_remove_handle($mh, $ch);
    }
    curl_multi_close($mh);
    return $urlData;
}

在该并发请求中,先创建一个批处理句柄,然后将urlcURL句柄添加到批处理句柄中,并不断查询批处理句柄的执行状态,当执行完成后,获取返回的结果。

curl_multi 相关函数

/** 函数作用:返回一个新cURL批处理句柄
    @return resource 成功返回cURL批处理句柄,失败返回false
*/
resource curl_multi_init ( void )

/** 函数作用:向curl批处理会话中添加单独的curl句柄
    @param $mh 由curl_multi_init返回的批处理句柄
    @param $ch 由curl_init返回的cURL句柄
    @return resource 成功返回cURL批处理句柄,失败返回false
*/
int curl_multi_add_handle ( resource $mh , resource $ch )

/** 函数作用:运行当前 cURL 句柄的子连接
    @param $mh 由curl_multi_init返回的批处理句柄
    @param $still_running 一个用来判断操作是否仍在执行的标识的引用
    @return 一个定义于 cURL 预定义常量中的 cURL 代码
*/
int curl_multi_exec ( resource $mh , int &$still_running )

/** 函数作用:等待所有cURL批处理中的活动连接
    @param $mh 由curl_multi_init返回的批处理句柄
    @param $timeout 以秒为单位,等待响应的时间
    @return 成功时返回描述符集合中描述符的数量。失败时,select失败时返回-1,否则返回超时(从底层的select系统调用).
*/
int curl_multi_select ( resource $mh [, float $timeout = 1.0 ] )

/** 函数作用:移除cURL批处理句柄资源中的某个句柄资源
    说明:从给定的批处理句柄mh中移除ch句柄。当ch句柄被移除以后,仍然可以合法地用curl_exec()执行这个句柄。如果要移除的句柄正在被使用,则这个句柄涉及的所有传输任务会被中止。
    @param $mh 由curl_multi_init返回的批处理句柄
    @param $ch 由curl_init返回的cURL句柄
    @return 成功时返回0,失败时返回CURLM_XXX中的一个
*/
int curl_multi_remove_handle ( resource $mh , resource $ch )

/** 函数作用:关闭一组cURL句柄
    @param $mh 由curl_multi_init返回的批处理句柄
    @return void
*/
void curl_multi_close ( resource $mh )

/** 函数作用:如果设置了CURLOPT_RETURNTRANSFER,则返回获取的输出的文本流
    @param $ch 由curl_init返回的cURL句柄
    @return string 如果设置了CURLOPT_RETURNTRANSFER,则返回获取的输出的文本流。
*/
string curl_multi_getcontent ( resource $ch )
本例中使用到的预定义常量:
CURLM_CALL_MULTI_PERFORM: (int) -1
CURLM_OK: (int) 0

PHP并发请求耗时对比

  1. 第一次请求使用上面的curl_multi_init方法,并发请求105次。

  2. 第二次请求使用传统的foreach方法,遍历105次使用curl_init方法请求。

实际的请求耗时结果为:

PHP에서 동시 요청을 구현하는 방법(코드)

刨除download的约765ms耗时,单纯的请求耗时优化达到了39.83/1.58达到了25倍,如果继续刨除建连相关的耗时,应该会更高。这其中的耗时:

  • 方案1:最慢的一个接口达到了1.58s

  • 方案2:105个接口的平均耗时是384ms

这个测试的请求是我的环境的内部接口,所以耗时很短,实际爬虫请求环境优化会更明显。

注意项

并发数限制

curl_multi会消耗很多的系统资源,在并发请求时并发数有一定阈值,一般为512,是由于CURL内部限制,超过最大并发会导致失败。

具体的测试结果我没有做,可以参考别人的文章:每次使用curl multi同时并发多少请求合适

超时时间

为了防止慢请求影响整个服务,可以设置CURLOPT_TIMEOUT来控制超时时间,防止部分假死的请求无限阻塞进程处理,最后打死机器服务。

CPU负载打满

在代码示例中,如果持续查询并发的执行状态,会导致cpu的负载过高,所以,需要在代码里加上usleep(50000);的语句。
同时,curl_multi_select也可以控制cpu占用,在数据有回应前会一直处于等待状态,新数据一来就会被唤醒并继续执行,减少了CPU

PHP에서 가장 직관적인 방법은 urlsforeach하고 각 요청의 결과를 저장하는 것입니다. 그런 다음 공급자가 평균을 제공합니다. 인터페이스는 5초가 걸리고 인터페이스 요청은 50초가 소요됩니다. 이는 속도와 성능을 추구하는 웹사이트에서는 허용되지 않습니다.

이때 동시요청을 하셔야 합니다.

PHP요청

PHP는 단일 프로세스 동기화 모델이며 하나의 요청은 하나의 프로세스에 해당하며 I/O code>는 동기화가 차단되었습니다. nginx/apache/php-fpm과 같은 서비스 확장을 통해 PHP는 프로세스 풀을 유지하고 프로세스가 존재할 때마다 새로운 프로세스를 시작하는 것을 원칙으로 합니다. 독립적으로.
PHP는 멀티스레딩 모드와 콜백 처리를 지원하지 않으므로 5s를 시작하면 PHP의 내부 스크립트가 동기적으로 차단됩니다. 요청하면 프로그램은 5초 동안 I/O를 차단하고 요청이 결과를 반환할 때까지 코드를 계속 실행하지 않습니다. 따라서 크롤러와 같은 높은 동시성 요청 요구 사항을 수행하는 것은 매우 어렵습니다.

그럼 동시 요청 문제를 해결하는 방법은 무엇일까요? 내장된 file_get_contentsfsockopen 요청 메서드 외에도 PHP는 요청을 시작하는 cURL 확장도 지원합니다. 일반 단일 요청을 지원하는 , 동시 요청도 지원하는 PHP cURL 요청에 대한 자세한 설명 동시성 원칙은 cURL 확장이 다중 요청을 관리하기 위해 멀티스레딩을 사용한다는 것입니다.

PHP동시 요청

demo 코드를 직접 살펴보겠습니다.

rrreee

이 동시 요청에서는 먼저 배치 핸들을 생성한 다음 urlcURL 핸들을 배치 핸들에 추가하고, 배치 핸들의 실행 상태를 지속적으로 쿼리하여 실행이 완료되면 반환된 결과를 얻습니다.

curl_multi 관련 함수

rrreee 이 예에 사용된 사전 정의된 상수: 🎜CURLM_CALL_MULTI_PERFORM: (int) -1🎜CURLM_OK: (int) 0

PHP동시 요청 시간 소모 비교

  1. 🎜첫 번째 요청에 위 내용을 사용 curl_multi_init 메소드에는 105개의 동시 요청이 있습니다. 🎜
  2. 🎜두 번째 요청은 기존 foreach 메서드를 사용하여 105번 순회하고 curl_init 메서드 요청을 사용합니다. 🎜
🎜실제 요청 시간이 많이 걸리는 결과는 다음과 같습니다.🎜🎜PHP에서 동시 요청을 구현하는 방법(코드)🎜🎜765ms다운로드 제외 /code>는 시간이 많이 걸리는 순수 요청의 최적화가 39.83/1.58에 도달했고 시간이 많이 걸리는 부분을 계속 제거하면 25번에 도달했습니다. 연결 설정과 관련하여 더 높아야 합니다. 시간 소모: 🎜
  • 🎜옵션 1: 가장 느린 인터페이스가 1.58s🎜
  • 에 도달함 🎜옵션 2: 평균 105 인터페이스의 시간 소모는 384ms🎜
이 테스트의 요청은 내 환경의 내부 인터페이스이므로 시간이 많이 소모됩니다. 짧고 실제 크롤러 요청 환경 최적화가 더 분명해집니다.

참고

동시성 제한

🎜curl_multi는 많은 시스템 리소스를 소비합니다. 동시 요청 수에는 특정 임계값이 있습니다(일반적으로 ). 512CURL의 내부 제한으로 인해 발생합니다. 최대 동시성을 초과하면 오류가 발생합니다. 🎜구체적인 테스트 결과는 해보지 않았습니다. 다른 분들의 글을 참고하시면 됩니다. 컬 멀티를 사용할 때마다 동시 요청 수는 몇 개가 적당한가요?

타임아웃 시간

🎜 느린 요청이 전체에 영향을 미치는 것을 방지하려면 서비스의 경우 CURLOPT_TIMEOUT을 설정하여 시간 초과를 제어하여 일부 일시 중단된 요청이 프로세스를 무기한 차단하고 결국 시스템 서비스를 종료하는 것을 방지할 수 있습니다. 🎜<h3> <code>CPU가 완전히 로드되었습니다🎜코드 예에서 동시 실행 상태를 계속 쿼리하면 cpu 로드가 발생하여 너무 높으므로 코드에 usleep(50000); 문을 추가해야 합니다. 🎜동시에 curl_multi_selectcpu 점유도 제어할 수 있습니다. 데이터가 응답될 때까지 대기 상태가 되며 즉시 실행됩니다. 새로운 데이터가 들어오면 CPU의 불필요한 소모를 줄여줍니다. 🎜🎜관련 권장 사항: 🎜🎜🎜AJAX 대기열 요청을 구현하는 방법(코드 포함) 🎜🎜🎜🎜🎜curl_multi를 사용하여 동시 요청을 구현하는 PHP 예제 PHP 기술 🎜🎜🎜🎜

위 내용은 PHP에서 동시 요청을 구현하는 방법(코드)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
python中CURL和python requests的相互转换如何实现python中CURL和python requests的相互转换如何实现May 03, 2023 pm 12:49 PM

curl和Pythonrequests都是发送HTTP请求的强大工具。虽然curl是一种命令行工具,可让您直接从终端发送请求,但Python的请求库提供了一种更具编程性的方式来从Python代码中发送请求。将curl转换为Pythonrequestscurl命令的基本语法如下所示:curl[OPTIONS]URL将curl命令转换为Python请求时,我们需要将选项和URL转换为Python代码。这是一个示例curlPOST命令:curl-XPOSThttps://example.com/api

Linux下更新curl版本教程!Linux下更新curl版本教程!Mar 07, 2024 am 08:30 AM

在Linux下更新curl版本,您可以按照以下步骤进行操作:检查当前curl版本:首先,您需要确定当前系统中安装的curl版本。打开终端,并执行以下命令:curl--version该命令将显示当前curl的版本信息。确认可用的curl版本:在更新curl之前,您需要确定可用的最新版本。您可以访问curl的官方网站(curl.haxx.se)或相关的软件源,查找最新版本的curl。下载curl源代码:使用curl或浏览器,下载您选择的curl版本的源代码文件(通常为.tar.gz或.tar.bz2

PHP8.1发布:引入curl多个请求并发处理PHP8.1发布:引入curl多个请求并发处理Jul 08, 2023 pm 09:13 PM

PHP8.1发布:引入curl多个请求并发处理近日,PHP官方发布了最新版本的PHP8.1,其中引入了一个重要的特性:curl多个请求并发处理。这个新特性为开发者提供了一个更加高效和灵活的方式来处理多个HTTP请求,极大地提升了性能和用户体验。在以往的版本中,处理多个请求往往需要通过创建多个curl资源,并使用循环来分别发送和接收数据。这种方式虽然能够实现目

从头到尾:如何使用php扩展cURL进行HTTP请求从头到尾:如何使用php扩展cURL进行HTTP请求Jul 29, 2023 pm 05:07 PM

从头到尾:如何使用php扩展cURL进行HTTP请求引言:在Web开发中,经常需要与第三方API或其他远程服务器进行通信。而使用cURL进行HTTP请求是一种常见而强大的方式。本文将介绍如何使用php扩展cURL来执行HTTP请求,并提供一些实用的代码示例。一、准备工作首先,确保php已安装cURL扩展。可以在命令行执行php-m|grepcurl查

PHP Curl中如何处理网页的 301 重定向?PHP Curl中如何处理网页的 301 重定向?Mar 08, 2024 am 11:36 AM

PHPCurl中如何处理网页的301重定向?在使用PHPCurl发送网络请求时,时常会遇到网页返回的301状态码,表示页面被永久重定向。为了正确处理这种情况,我们需要在Curl请求中添加一些特定的选项和处理逻辑。下面将详细介绍在PHPCurl中如何处理网页的301重定向,并提供具体的代码示例。301重定向处理原理301重定向是指服务器返回了一个30

如何利用C++实现一个简单的网页爬虫程序?如何利用C++实现一个简单的网页爬虫程序?Nov 04, 2023 am 11:37 AM

如何利用C++实现一个简单的网页爬虫程序?简介:互联网是一个信息的宝库,而通过网页爬虫程序可以轻松地从互联网上获取大量有用的数据。本文将介绍如何使用C++编写一个简单的网页爬虫程序,以及一些常用的技巧和注意事项。一、准备工作安装C++编译器:首先需要在计算机上安装一个C++编译器,例如gcc或者clang。可以通过命令行输入"g++-v"或者"clang

linux curl是什么linux curl是什么Apr 20, 2023 pm 05:05 PM

在linux中,​curl是一个非常实用的、用来与服务器之间传输数据的工具,是一个利用URL规则在命令行下工作的文件传输工具;它支持文件的上传和下载,是综合传输工具。curl提供了一大堆非常有用的功能,包括代理访问、用户认证、ftp上传下载、HTTP POST、SSL连接、cookie支持、断点续传等等。

Vue 中如何进行跨域请求?Vue 中如何进行跨域请求?Jun 10, 2023 pm 10:30 PM

Vue是一种流行的JavaScript框架,用于构建现代化的Web应用程序。在使用Vue开发应用程序时,常常需要与不同的API交互,而这些API往往位于不同的服务器上。由于跨域安全策略的限制,当Vue应用程序在一个域名上运行时,它不能直接与另一个域名上的API进行通信。本文将介绍几种在Vue中进行跨域请求的方法。1.使用代理一种常见的跨域解决方案是使用代理

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

SecList

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

에디트플러스 중국어 크랙 버전

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

Atom Editor Mac 버전 다운로드

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기

PhpStorm 맥 버전

PhpStorm 맥 버전

최신(2018.2.1) 전문 PHP 통합 개발 도구