問題陳述:
建立一個列出來自某個頁面的所有圖像的頁面網站及其標題和替代表示形式,需要一種從HTML 中提取這些屬性的方法。屬性的順序可能會有所不同,而取得所有屬性會帶來挑戰。
使用正規表示式擷取資料:
最初,可以使用正規表示式來解決問題表達式。然而,由於屬性的順序不同,這種方法並不優雅,可能會導致逐字解析過程很費力。
DOMDocument 解:
另一種方法是利用 PHP DOMDocument 類別。此類別可以解析 HTML 並存取其元素。以下是實現此目的的程式碼:
$url = "http://example.com"; $html = file_get_contents($url); $doc = new DOMDocument(); @$doc->loadHTML($html); $tags = $doc->getElementsByTagName('img'); foreach ($tags as $tag) { echo $tag->getAttribute('src').', '; echo $tag->getAttribute('title').', '; echo $tag->getAttribute('alt').'<br>'; }
說明:
此程式碼初始化 DOMDocument 物件並將 HTML 載入其中。 getElementsByTagName 方法用於檢索所有影像。然後迭代每個 img 標籤,並使用 getAttribute 方法提取 src、title 和 alt 屬性。提取的資料被回顯,從而得到影像資訊的格式化輸出。
以上是如何使用 PHP 有效率地從 HTML 中提取圖像資料(src、title、alt)?的詳細內容。更多資訊請關注PHP中文網其他相關文章!