ホームページ  >  記事  >  バックエンド開発  >  php シンプルな html dom パーサーを使用して html タグを解析する_PHP チュートリアル

php シンプルな html dom パーサーを使用して html タグを解析する_PHP チュートリアル

WBOY
WBOYオリジナル
2016-07-14 10:07:221392ブラウズ

php simple html dom parserを使用してhtmlタグを解析します
しばらく使ってみました
PHP シンプルな HTML DOM パーサー
HTML ページを解析すると、DOM ツリーを作成して HTML のコンテンツを解析しやすくなります。物を掴むのに適しています。
サンプルが添付されているので、sourceforge にアクセスして圧縮パッケージをダウンロードし、中のサンプルを確認することもできます:
PHP Simple HTML DOM Parser を使用したデータのスクレイピング
PHP5+ で書かれた PHP Simple HTML DOM Parser を使用すると、無効な HTML をサポートし、非常に簡単な方法で HTML を操作できます。このパーサーは、複雑な正規表現を使用して Web ページから情報を抽出する他の PHP スクリプトよりも優れています。
必要な情報を取得する前に、URL またはファイルから DOM を作成する必要があります。次のスクリプトは Web サイトからリンクと画像を抽出します。
クリップボードへのプレーンコピーを表示して印刷しますか?
Php コード // URL またはファイルから DOM を作成
$html = file_get_html('http://www.microsoft.com/');
// リンクを抽出する
foreach($html->find('a') as $element)
echo echo $ element-> href。
// 画像を抽出する
foreach($html->find('img') as $element)
$element->src '
';
[php]
// URL またはファイルから DOM を作成
$html = file_get_html('http://www.microsoft.com/');
// リンクを抽出する
foreach($html->find('a') as $element)
$element->href '
';
// 画像を抽出する
foreach($html->find('img') as $element)
$element->src '
';
// URL またはファイルから DOM を作成します
$html = file_get_html('http://www.microsoft.com/');
//リンクを抽出します
foreach($html->find('a') as $element)
$element->href '
';
//画像を抽出する
foreach($html->find('img') as $element)
echo $element->src '
';
パーサーは HTML 要素の変更にも使用できます:
クリップボードへのプレーンコピーを表示して印刷しますか?
Php コード // 文字列から DOM を作成
$html = str_get_html('
シンプル
パーサー
');
$html->find('div', 1)->class = 'bar';
$html->find('div[id=simple]', 0)->innertext = 'Foo';
// 出力:
Foo
パーサー
エコー $html
[php]
// 文字列から DOM を作成する
$html = str_get_html('
シンプル
パーサー
');
$html->find('div', 1)->class = 'bar';
$html->find('div[id=simple]', 0)->innertext = 'Foo';
// 出力:
Foo
パーサー
エコー $html
//文字列からDOMを作成する
$html = str_get_html('
シンプル
パーサー
');
$html->find('div', 1)->class = 'bar';
$html->find('div[id=simple]', 0)->innertext = 'Foo';
// 出力:
Foo
Parser
エコー $html;
タグなしでコンテンツを取得しますか?
クリップボードへの普通のコピーを表示して印刷しますか? 
Php代码 echo file_get_html('http://www.yahoo.com/')->plaintext;  
[php]
echo file_get_html('http://www.yahoo.com/')->平文;  
echo file_get_html('http://www.yahoo.com/')->plaintext;このパーサーのパッケージ ファイル ([url]http://simplehtmldom.sourceforge.net/[/url]) では、次のことができます。 digg、imdb、slashdot からスクレイピングの例をいくつか見つけてください。 Google からキーワード「php」の最初の 10 件の結果 (タイトルのみ) を抽出するものを作成しましょう:
クリップボードへの普通のコピーを表示して印刷しますか? 
Php代码 $url = 'http://www.google.com/search?hl=ja&q=php&btnG=Search';    
// URL から DOM を作成
$html = file_get_html($url);    
// 「l」と等しい class 属性を持つすべての「A」タグと一致します
foreach($html->find('a[class=l]') as $key => $info)
{
エコー ($key + 1).'。 '.$info->plaintext."
n";    
}
[php]
$url = 'http://www.google.com/search?hl=ja&q=php&btnG=Search';  
// URL から DOM を作成
$html = file_get_html($url);  
// 「l」と等しい class 属性を持つすべての「A」タグと一致します
foreach($html->find('a[class=l]') as $key => $info)
{
エコー ($key + 1).'。 '.$info->plaintext."
n";  
}
$url = 'http://www.google.com/search?hl=ja&q=php&btnG=Search';
// URLからDOMを作成
$html = file_get_html($url);
// 'l' と等しい class 属性を持つすべての 'A' タグと一致します
foreach($html->find('a[class=l]') as $key => $info)
{
エコー ($key + 1).'。 '.$info->plaintext."
n";
}注: パーサーの関数を使用する前に、必ずパーサーを含めてください:
クリップボードへの普通のコピーを表示して印刷しますか? 
Php代码
「simple_html_dom.php」をインクルードします。  
[php]
「simple_html_dom.php」をインクルードします。  
include 'simple_html_dom.php';この関数の使用法に関する詳細については、「PHP Simple HTML Dom Parser」マニュアルを確認することを検討してください。パッケージ ファイルをダウンロードするには、次の URL を使用します: [url]
分享:

www.bkjia.com本当http://www.bkjia.com/PHPjc/477857.html技術記事使用php simple html dom parser解析html标签用了一下PHP Simple HTML DOM Parser解析HTML页面,感觉还不错,它能创建一个DOMツリー方便你html里面的内...
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。