ホームページ >バックエンド開発 >PHPチュートリアル >正規表現と DOM 解析: HTML から `href` 属性を抽出するにはどちらが最適ですか?
A 要素の href 属性の取得: 正規表現と DOM 解析
HTML ページからリンク情報を抽出するには慎重な取り扱いが必要ですhref 属性の。正規表現は基本的なアプローチを提供しますが、href 属性が a タグの最初に配置されていない場合、問題が発生する可能性があります。
信頼できる代替手段は、Document Object Model (DOM) 解析を利用することです。 DOM を使用して href 属性情報を効果的に取得する方法は次のとおりです。
$dom = new DOMDocument; $dom->loadHTML($html); foreach ($dom->getElementsByTagName('a') as $node) { echo $dom->saveHtml($node), PHP_EOL; }
このコードは、$html 文字列内のすべての A 要素の「outerHTML」を検索して出力します。
さらに、DOM は次の機能:
$nodes = $xpath->query('//a/@href'); foreach ($nodes as $href) { echo $href->nodeValue; // echo current attribute value }
DOM は、次のような包括的なソリューションを提供します。 HTML を解析し、href 属性情報を効率的に抽出します。堅牢で信頼性の高い結果を得るには、このアプローチを検討してください。さらに詳しく調べるために、提供されているリソースも参照してください。
以上が正規表現と DOM 解析: HTML から `href` 属性を抽出するにはどちらが最適ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。