從 A 元素中提取 href 屬性
尋求檢索網頁上的鏈接,一種常見的方法是通過正則表達式。但是,特定場景可能會帶來挑戰,例如當 href 屬性未位於 A 標記中的第一位時。
正規表示式方法
您的初始正規表示式,針對href 屬性位於A 標記內的任何位置,遇到類似情況的困難「什麼?
基於 DOM 的解決方案
考慮到正規表示式對於可靠 HTML 解析的限制,更強大的解決方案是 DOMDocument PHP 中的類別。以下是一個範例:$dom = new DOMDocument; $dom->loadHTML($html); foreach ($dom->getElementsByTagName('a') as $node) { echo $dom->saveHtml($node), PHP_EOL; }此程式碼將 HTML 內容載入到 DOMDocument 物件中,然後使用 getElementsByTagName 方法擷取所有 A 元素。
DOM 操作
使用DOM,可以對A標籤進行各種操作elements:屬性的 XPath提取:
XPath 為屬性提取提供了另一種選項。這是一個例子:$xpath = new DOMXPath($dom); $nodes = $xpath->query('//a/@href'); foreach($nodes as $href) { echo $href->nodeValue; }
其他資源:
以上是如何可靠地從 HTML 中的 A 元素中提取 href 屬性?的詳細內容。更多資訊請關注PHP中文網其他相關文章!