搜尋
首頁PHP 函式庫其它類別庫phP的抓取網站類別庫
phP的抓取網站類別庫
<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
    'image' => array('img','src')
    ))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
    'link' => array('a','href')
    ))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
    'title' => array('h1','text'),
    'date' => array('.pt_info','text','-span -a',function($content){
        $arr = explode(' ',$content);
        return $arr[0];
    }),
    'content' => array('.post_content','html','a -.content_copyright -script',function($content){
     
            $doc = phpQuery::newDocumentHTML($content);
            $imgs = pq($doc)->find('img');
            foreach ($imgs as $img) {
                $src = 'http://cms.querylist.cc'.pq($img)->attr('src');
                $localSrc = 'w/'.md5($src).'.jpg';
                $stream = file_get_contents($src);
                file_put_contents($localSrc,$stream);
                pq($img)->attr('src',$localSrc);
            }
            return $doc->htmlOuter();
    })
    );
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);

支援抓取網站,進行爬蟲,非常強大,是一個基於PHP的服務端開源項目,它可以讓PHP開發人員輕鬆處理DOM文檔內容,例如獲取某新聞網站的頭條信息。更有趣的是,它採用了jQuery的思想,你可以像使用jQuery一樣處理頁面內容,獲得你想要的頁面資訊。

免責聲明

本站所有資源皆由網友貢獻或各大下載網站轉載。請自行檢查軟體的完整性!本站所有資源僅供學習參考。請不要將它們用於商業目的。否則,一切後果都由您負責!如有侵權,請聯絡我們刪除。聯絡方式:admin@php.cn

相關文章

國內有類似phpclasses這樣的PHP類別庫及功能模組分享網站嗎?國內有類似phpclasses這樣的PHP類別庫及功能模組分享網站嗎?

11Oct2016

如題:國內有類似phpclasses這樣的PHP類別庫及功能模組分享網站嗎?就是一些擴充拿過來就能直接使用或學習的

如何使用PHP Goutte類別庫進行網頁爬取與資料擷取?如何使用PHP Goutte類別庫進行網頁爬取與資料擷取?

09Aug2023

如何使用PHPGoutte類別庫進行網頁爬取與資料擷取?概述:在日常的開發過程中,我們經常需要從網路上取得各種數據,例如電影排名、天氣預報等等。而網頁爬取則是取得這些資料的常用方法之一。在PHP開發中,我們可以利用Goutte類別庫來實現網頁爬取與資料擷取的功能。本文將介紹如何使用PHPGoutte類別庫進行網頁爬取與資料擷取,並附上程式碼範例。什麼是Gout

關於PHP建立資料庫存取類別的封裝的方法關於PHP建立資料庫存取類別的封裝的方法

12Sep2017

建立資料庫存取類別的封裝

gd庫圖片下載類別實作下載網頁所有圖片的php程式碼gd庫圖片下載類別實作下載網頁所有圖片的php程式碼

01Dec2016

gd庫圖片下載類別實作下載網頁所有圖片的php程式碼

如何從不同的 PHP 類別正確存取 MySQLi 資料庫連線?如何從不同的 PHP 類別正確存取 MySQLi 資料庫連線?

18Dec2024

從 PHP 中的其他類別存取 MySQLi 連線從 PHP 5.6 升級到 7.0 時,必須從 MySQL 過渡到 MySQLi。這...

如何將excel轉換成word 如何跨站抓取別的網站的頁面的補充如何將excel轉換成word 如何跨站抓取別的網站的頁面的補充

29Jul2016

如何將excel轉換成word:如何將excel轉換成word 如何跨站抓取別的網站的頁面的補充:在實際的應用程式中,經常會遇到一些特殊的情況,例如需要新聞,天氣預報,等等,但是作為個人站點或實力小的站點我們不可能有那麼多的人力物力財力去做這些事情,該怎麼辦呢? 還好網路是 資源共享的,我們可以利用程式 自動的把別的網站的頁面抓取回來經過處理後被我們所利用。 用什麼呢,那個戰友給的是不行的,其實在Php有這個功能,那就是用curl函式庫。請看下面的程式碼!

See all articles