ホームページ >バックエンド開発 >PHPチュートリアル >PHP で HTML を解析して、正規表現を使用せずに見出し間のテキストを抽出する方法

PHP で HTML を解析して、正規表現を使用せずに見出し間のテキストを抽出する方法

Susan Sarandon
Susan Sarandonオリジナル
2024-12-07 22:58:13956ブラウズ

How to Parse HTML in PHP to Extract Text Between Headings Without Regular Expressions?

PHP HTML コードの解析

Q: PHP 変数に格納されている HTML コードを解析して見出し間のテキストを抽出するにはどうすればよいですか。正規表現を使用せずに?

A: PHP ドキュメント オブジェクトを使用します。モデル:

$DOM = new DOMDocument;
$DOM->loadHTML($html);
$items = $DOM->getElementsByTagName('h1');
for ($i = 0; $i < $items->length; $i++)
    echo $items->item($i)->nodeValue . "<br/>";

見出し間のコンテンツが必要な場合は、次の正規表現を使用します:

echo preg_replace("#<h1.*?>.*?</h1>#", "", $html);

以上がPHP で HTML を解析して、正規表現を使用せずに見出し間のテキストを抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。