ホームページ >バックエンド開発 >PHPチュートリアル >phpQuery を使用して Web ページを収集する方法_PHP チュートリアル

phpQuery を使用して Web ページを収集する方法_PHP チュートリアル

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBオリジナル
2016-07-13 10:25:111309ブラウズ

phpQuery は、PHP に基づいたサーバー側のオープン ソース プロジェクトであり、PHP 開発者がニュース Web サイトの見出し情報を取得するなど、DOM ドキュメントのコンテンツを簡単に処理できるようにします。さらに興味深いのは、jQuery の考え方を使用していることです。jQuery を使用するのと同じようにページのコンテンツを処理して、必要なページ情報を取得できます。
見出しを収集する
まず例を見てみましょう。 Sina から国内ニュースの見出しを収集したいと思います。 コードは次のとおりです。

コードをコピーします。 コードは次のとおりです:
include ' phpQuery/phpQuery.php';
phpQuery:: newDocumentFile('http://www.jb51.net');
echo pq(".blkTop h1:eq(0)");


わずか 3 行のコード内容で見出しを取得できます。まず、プログラムに phpQuery.php コア プログラムを組み込み、次に対象の Web ページを呼び出して読み取り、最後に対応するタグの下にコンテンツを出力します。
pq() は、jQuery の $() と同じように、基本的に phpQuery で使用できる強力なメソッドです。「.」を「->」に変更するだけです。上の例のように、pq(".blkTop h1:eq(0)") は、ページ上のクラス属性が blkTop である DIV 要素を取得し、DIV 内の最初の h1 タグを見つけて、html() メソッドを使用してh1 タグの取得 コンテンツ (html タグ付き) は、取得したい見出し情報です。 text() メソッドを使用すると、見出しのテキスト コンテンツのみが取得されます。もちろん、phpQuery をうまく使用するには、ドキュメント内で対応するコンテンツを持つノードを見つけることが重要です。
記事リストを収集する
helloweba.com Web サイトのブログ リストを取得する別の例を見てみましょう。コードを参照してください:


コードをコピーする コードは次のとおりです:
include 'phpQuery/phpQuery. php';
phpQuery: :newDocumentFile('http://www.jb51.net');
$artlist = pq(".blog_li"){
echo pq($li) )->find( 'h2')->html()."";
}


リスト内の DIV をループして記事のタイトルを見つけて出力するのはとても簡単です。
XML ドキュメントを解析します
次のような test.xml ドキュメントがあるとします。



コードをコピーします
コードは次のとおりです:

张三
lt;name>王五
18
< ;/contact>



ここで、Zhang San という名前の連絡先の年齢を取得したいと思います。コードは次のとおりです:



コードをコピーします

コードは次のとおりです:
include 'phpQuery/phpQuery.php'; phpQuery::newDocumentFile('test.xml'); echo pq('contact > age:eq(0)'); 結果出力: 22

jQueryは、ドキュメント ノードを正確に検索し、そのノードの下にあるコンテンツを出力します。XML ドキュメントを解析するのは非常に簡単です。 phpQuery を使用すると、Web サイトのコンテンツを収集するために、面倒な通常のアルゴリズム、コンテンツ置換、その他の面倒なコードを使用する必要がなくなります。
phpqueryプロジェクト公式Webサイトアドレス:http://code.google.com/p/phpquery/


http://www.bkjia.com/PHPjc/825181.html

www.bkjia.com

tru​​e

技術記事 phpQuery は、PHP に基づいたサーバー側のオープン ソース プロジェクトであり、PHP 開発者がニュース Web サイトの見出し情報を取得するなど、DOM ドキュメントのコンテンツを簡単に処理できるようにします。さらに興味深いのは、...を使用していることです。
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。