一、引言
這段時間比較忙,已經很久沒有寫部落格了。今天我就來聊聊我關於curl_multi_*函數集的使用心得,關於http請求的問題。
當我們用戶php發起一個http請求的時候。我們會先想到用什麼?沒錯,我們會建立curl來請求。當我們在一次執行中需要發起多個http請求。這簡單,對每一個URL發起一次url請求。請求玩第1個再請求第2個….這就完了?哪我們還說個啥。
官網連結:http://php.net/manual/zh/book.curl.php
二、多次簡單的curl請求弊端
我們舉個栗子。現在有三個http請求。每個請求耗時2s。如果按照簡單的curl請求(圖1-(1))。耗時6s.這是不能容忍的。如果請求的個數越多耗時約多。
有沒有一種方式來縮小查詢時間?能不能三個http請求同時執行(如圖1-(1))?有很多方法來解決這個問題,將耗時減少到2s。如:多進程、執行緒、事件循環、curl_multi_*等等。最簡單的方式就是透過curl_multi_*函數來完成。事實上curl_multi_*內部實作就是用的事件循環。
三、簡單的curl_multi_*運用
<code><span><?php </span><span>/** * * curl_multi_*简单运用 * *<span> @author</span>: rudy *<span> @date</span>: 2016/07/12 */</span><span>/** * 根据url,postData获取curl请求对象,这个比较简单,可以看官方文档 */</span><span><span>function</span><span>getCurlObject</span><span>(<span>$url</span>,<span>$postData</span>=array<span>()</span>,<span>$header</span>=array<span>()</span>)</span>{</span><span>$options</span> = <span>array</span>(); <span>$url</span> = trim(<span>$url</span>); <span>$options</span>[CURLOPT_URL] = <span>$url</span>; <span>$options</span>[CURLOPT_TIMEOUT] = <span>10</span>; <span>$options</span>[CURLOPT_USERAGENT] = <span>'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.89 Safari/537.36'</span>; <span>$options</span>[CURLOPT_RETURNTRANSFER] = <span>true</span>; <span>// $options[CURLOPT_PROXY] = '127.0.0.1:8888';</span><span>foreach</span>(<span>$header</span><span>as</span><span>$key</span>=><span>$value</span>){ <span>$options</span>[<span>$key</span>] =<span>$value</span>; } <span>if</span>(!<span>empty</span>(<span>$postData</span>) && is_array(<span>$postData</span>)){ <span>$options</span>[CURLOPT_POST] = <span>true</span>; <span>$options</span>[CURLOPT_POSTFIELDS] = http_build_query(<span>$postData</span>); } <span>if</span>(stripos(<span>$url</span>,<span>'https'</span>) === <span>0</span>){ <span>$options</span>[CURLOPT_SSL_VERIFYPEER] = <span>false</span>; } <span>$ch</span> = curl_init(); curl_setopt_array(<span>$ch</span>,<span>$options</span>); <span>return</span><span>$ch</span>; } <span>// 创建三个待请求的url对象</span><span>$chList</span> = <span>array</span>(); <span>$chList</span>[] = getCurlObject(<span>'https://www.baidu.com'</span>); <span>$chList</span>[] = getCurlObject(<span>'http://www.jd.com'</span>); <span>$chList</span>[] = getCurlObject(<span>'http://www.jianshu.com/'</span>); <span>// 创建多请求执行对象</span><span>$downloader</span> = curl_multi_init(); <span>// 将三个待请求对象放入下载器中</span><span>foreach</span> (<span>$chList</span><span>as</span><span>$ch</span>){ curl_multi_add_handle(<span>$downloader</span>,<span>$ch</span>); } <span>// 轮询</span><span>do</span> { <span>while</span> ((<span>$execrun</span> = curl_multi_exec(<span>$downloader</span>, <span>$running</span>)) == CURLM_CALL_MULTI_PERFORM) ; <span>if</span> (<span>$execrun</span> != CURLM_OK) { <span>break</span>; } <span>// 一旦有一个请求完成,找出来,处理,因为curl底层是select,所以最大受限于1024</span><span>while</span> (<span>$done</span> = curl_multi_info_read(<span>$downloader</span>)) { <span>// 从请求中获取信息、内容、错误</span><span>$info</span> = curl_getinfo(<span>$done</span>[<span>'handle'</span>]); <span>$output</span> = curl_multi_getcontent(<span>$done</span>[<span>'handle'</span>]); <span>$error</span> = curl_error(<span>$done</span>[<span>'handle'</span>]); <span>// 将请求结果保存,我这里是打印出来</span><span>print</span><span>$output</span>; <span>// print "一个请求下载完成!\n";</span><span>// 把请求已经完成了得 curl handle 删除</span> curl_multi_remove_handle(<span>$downloader</span>, <span>$done</span>[<span>'handle'</span>]); } <span>// 当没有数据的时候进行堵塞,把 CPU 使用权交出来,避免上面 do 死循环空跑数据导致 CPU 100%</span><span>if</span> (<span>$running</span>) { <span>$rel</span> = curl_multi_select(<span>$downloader</span>, <span>1</span>); <span>if</span>(<span>$rel</span> == -<span>1</span>){ usleep(<span>1000</span>); } } <span>if</span>( <span>$running</span> == <span>false</span>){ <span>break</span>; } } <span>while</span> (<span>true</span>); <span>// 下载完毕,关闭下载器</span> curl_multi_close(<span>$downloader</span>); <span>echo</span><span>"所有请求下载完成!"</span>;</span></code>
在這個例子中,首先建立三個或多個要請求的url請求物件。透過curl_multi_*函數建立下載器。將請求寫入下載器中。最後輪詢。等待三個請求現在完成。做處理。
四、複雜的curl_multi_*運用
這就是curl_multi_*用法? too yong too simple!在上面的例子中。下載器$downloader中的請求是一開始就添加好了的。我們能不能動態的向下載器中新增請求。動態的從下載器中取出已經完成了的請求。想想。這是什麼?這不就是爬蟲的核心部分-動態下載器。如何動態的新增?我們可以用多進程透過IPC添加。我們可以透過協程透過隊列添加等待。
').addClass('pre-numbering').hide(); $(this).addClass('has-numbering').parent().append($numbering); for (i = 1; i ').text(i)); }; $numbering.fadeIn(1700); }); });我這實作了一個透過協程+curl_multi_*的爬蟲框架。
Tspider:https://github.com/hirudy/Tspider。
單一進程可處理請求2000-5000/min。
以上就介紹了 php中curl_multi函數集的用法,包括了方面的內容,希望對PHP教程有興趣的朋友有幫助。

PHP在現代Web開發中仍然重要,尤其在內容管理和電子商務平台。 1)PHP擁有豐富的生態系統和強大框架支持,如Laravel和Symfony。 2)性能優化可通過OPcache和Nginx實現。 3)PHP8.0引入JIT編譯器,提升性能。 4)雲原生應用通過Docker和Kubernetes部署,提高靈活性和可擴展性。

PHP適合web開發,特別是在快速開發和處理動態內容方面表現出色,但不擅長數據科學和企業級應用。與Python相比,PHP在web開發中更具優勢,但在數據科學領域不如Python;與Java相比,PHP在企業級應用中表現較差,但在web開發中更靈活;與JavaScript相比,PHP在後端開發中更簡潔,但在前端開發中不如JavaScript。

PHP和Python各有優勢,適合不同場景。 1.PHP適用於web開發,提供內置web服務器和豐富函數庫。 2.Python適合數據科學和機器學習,語法簡潔且有強大標準庫。選擇時應根據項目需求決定。

PHP是一種廣泛應用於服務器端的腳本語言,特別適合web開發。 1.PHP可以嵌入HTML,處理HTTP請求和響應,支持多種數據庫。 2.PHP用於生成動態網頁內容,處理表單數據,訪問數據庫等,具有強大的社區支持和開源資源。 3.PHP是解釋型語言,執行過程包括詞法分析、語法分析、編譯和執行。 4.PHP可以與MySQL結合用於用戶註冊系統等高級應用。 5.調試PHP時,可使用error_reporting()和var_dump()等函數。 6.優化PHP代碼可通過緩存機制、優化數據庫查詢和使用內置函數。 7

PHP成為許多網站首選技術棧的原因包括其易用性、強大社區支持和廣泛應用。 1)易於學習和使用,適合初學者。 2)擁有龐大的開發者社區,資源豐富。 3)廣泛應用於WordPress、Drupal等平台。 4)與Web服務器緊密集成,簡化開發部署。

PHP在現代編程中仍然是一個強大且廣泛使用的工具,尤其在web開發領域。 1)PHP易用且與數據庫集成無縫,是許多開發者的首選。 2)它支持動態內容生成和麵向對象編程,適合快速創建和維護網站。 3)PHP的性能可以通過緩存和優化數據庫查詢來提升,其廣泛的社區和豐富生態系統使其在當今技術棧中仍具重要地位。

在PHP中,弱引用是通過WeakReference類實現的,不會阻止垃圾回收器回收對象。弱引用適用於緩存系統和事件監聽器等場景,需注意其不能保證對象存活,且垃圾回收可能延遲。

\_\_invoke方法允許對象像函數一樣被調用。 1.定義\_\_invoke方法使對象可被調用。 2.使用$obj(...)語法時,PHP會執行\_\_invoke方法。 3.適用於日誌記錄和計算器等場景,提高代碼靈活性和可讀性。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

Dreamweaver Mac版
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

SublimeText3 Linux新版
SublimeText3 Linux最新版

WebStorm Mac版
好用的JavaScript開發工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。