ホームページ >バックエンド開発 >PHPチュートリアル >正規表現を使用せずに PHP でタグ間のテキストを抽出する方法
PHP で HTML コードを解析する方法
問題:
見出しタグ (<) 間のテキストを抽出する;h1>) PHP に保存された HTML コードから変数。
要件:
正規表現の使用を避けます。
解決策:
解析にはいくつかの手法がありますPHP の HTML コード。非正規表現の推奨方法は、PHP ドキュメント オブジェクト モデル (DOM) を使用することです。
<?php $str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG!'; $DOM = new DOMDocument; $DOM->loadHTML($str); // Retrieve all heading elements $items = $DOM->getElementsByTagName('h1'); // Extract and display the text content for ($i = 0; $i < $items->length; $i++) { echo $items->item($i)->nodeValue . "<br\>"; } ?>
このコードの出力:
T1 T2 T3
拡張ソリューション:
見出しタグ間のコンテンツを取得する必要がある場合は、次の通常のメソッドを使用します。式:
<?php $str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG!'; echo preg_replace("#<h1.*?>.*?</h1>#", "", $str); ?>
このコードの出力:
Lorem ipsum.The quick red fox...... jumps over the lazy brown FROG
以上が正規表現を使用せずに PHP でタグ間のテキストを抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。