ホームページ  >  記事  >  バックエンド開発  >  PHP は simple_html_dom を使用して HTML の例を解析します

PHP は simple_html_dom を使用して HTML の例を解析します

WBOY
WBOYオリジナル
2016-07-27 16:56:171128ブラウズ

この記事の例では、PHP が simple_html_dom を使用して HTML を解析する方法を説明します。詳細は次のとおりです:

今日は 2 つのクローラーを作成しました。1 つは Python を使用し、もう 1 つは PHP を使用します。正直に言うと、どちらの実装方法も非常に便利です。

オープンの使用について話しましょう。ソースクラス simple_html_dom HTML コードを解析します:

1. simple_html_dom:

http://sourceforge.net/projects/simplehtmldom/files/

をダウンロードするか、ここをクリックしてこのサイトからダウンロードします。

2. 使用例:

<&#63;php
// example of how to use basic selector to retrieve HTML contents
include('../simple_html_dom.php');
// get DOM from URL or file
$html = file_get_html('http://www.google.com/');
// find all link
foreach($html->find('a') as $e) 
  echo $e->href . '<br>';
// find all image
foreach($html->find('img') as $e)
  echo $e->src . '<br>';
// find all image with full tag
foreach($html->find('img') as $e)
  echo $e->outertext . '<br>';
// find all div tags with id=gbar
foreach($html->find('div#gbar') as $e)
  echo $e->innertext . '<br>';
// find all span tags with class=gb1
foreach($html->find('span.gb1') as $e)
  echo $e->outertext . '<br>';
// find all td tags with attribite align=center
foreach($html->find('td[align=center]') as $e)
  echo $e->innertext . '<br>';
// extract text from table
echo $html->find('td[align="center"]', 1)->plaintext.'<br><hr>';
// extract text from HTML
echo $html->plaintext;
?>

PHP 関連のコンテンツに興味のある読者は、このサイトの特別トピック「PHP コーディングおよびトランスコーディング操作スキルの概要」、「PHP オブジェクトの入門チュートリアル」を参照してください。 「Oriented Programming」、「PHP 算術演算スキルまとめ」、「PHP 配列 (Array) 演算スキル総まとめ」、「PHP 文字列 (string) の使い方まとめ」、「PHP データ構造とアルゴリズム チュートリアル」、「PHP プログラミング アルゴリズム」 summary」、「php正規表現 「数式の使い方まとめ」と「PHPデータベースの一般的な操作スキルまとめ」

この記事がPHPプログラミングの皆様のお役に立てれば幸いです。

上記では、PHP で HTML を解析するために simple_html_dom を使用する例を、関連する内容も含めて紹介しています。PHP チュートリアルに興味のある友人に役立つことを願っています。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。