首頁  >  文章  >  後端開發  >  php如何實作爬取資料(附程式碼)

php如何實作爬取資料(附程式碼)

不言
不言原創
2018-09-15 17:06:0410062瀏覽

這篇文章帶給大家的內容是關於php如何實現爬取資料(附程式碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有幫助。

官方網站網站:簡單、 靈活、強大的PHP採集工具,讓採集更簡單一點。

簡介:
QueryList使用jQuery選擇器來做採集,讓你告別複雜的正規表示式;QueryList具有jQuery一樣的DOM操作能力、Http網路操作能力、亂碼解決能力、內容過濾能力以及可擴展能力;可以輕鬆實現諸如:模擬登陸、偽造瀏覽器、HTTP代理等意複雜的網絡請求;擁有豐富的插件,支援多線程採集以及使用PhantomJS採集JavaScript動態渲染的頁面。

安裝

透過Composer安裝:

composer require jaeger/querylist

使用教學:

直接上程式碼:

  <?php
include &#39;./vendor/autoload.php&#39;;
// 使用composer安装后引入目录
use QL\QueryList;
// 使用插件

$html = file_get_contents(&#39;https://www.biqudu.com/14_14778/&#39;);
// 手动获取页面
$data = QueryList::html($html);
// 得到页面内容
$data = QueryList::setHtml(&#39;https://www.biqudu.com/14_14778/&#39;);
// 等同于上面的html()
$data->rules([
    // 采集所有a标签的href属性
    &#39;link&#39; => [&#39;a&#39;,&#39;href&#39;],
    // 采集所有a标签的文本内容
    &#39;text&#39; => [&#39;a&#39;,&#39;text&#39;]
    ]);
// 此处$data = 上面已经获取到网页内容之后的对象
// 设置采集规则 替代了传统正则
$data->query();
// 此处$data = 上面已经获取到网页内容之后的对象 
// query 执行操作
$data->getData();
// 此处$data = 上面已经获取到网页内容之后的对象
// 得到数据结果
$data->all();
// 此处$data = 上面已经获取到网页内容之后的对象
// 将数据转换成二维数组
print_r($data->all());
// 打印结果

上面的基本使用方法就是這樣了這樣我們已經可以抓取到一定的資料了

相關推薦:

php爬取天貓和淘寶商品資料步驟詳解(附程式碼)

PHP程式碼實作爬蟲記錄超管用,php程式碼爬蟲

#

以上是php如何實作爬取資料(附程式碼)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn