PHP 中的DOMDocument:解析和操作HTML 文件
處理HTML 文件時,DOM(文件模型)提供了結構化和物件文檔內容的物件導向表示。 PHP 的 DOMDocument 類別使我們能夠在節點層級與 HTML 文件進行互動和修改。
要使用 DOMDocument 解析 HTML 文檔,我們按照以下步驟操作:
- 建立一個 DOMDocument 物件並使用 loadHTML() 載入 HTML 內容。
- 使用 DOMXPath 查詢和操作解析後的內容
在您的範例中,您想要提取所有
HTML 表中的標籤並分析其內容。但是,您提供的程式碼從結果中剝離了 HTML 標籤,這是不可取的。 為了保留 HTML 標籤,我們需要了解 DOMDocument 將整個 HTML 文件表示為分層樹結構,其中代表各種元素(例如
或 標籤)和文字的節點。 $dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$trs = $xpath->query('//tr[@id="showContent"]');
foreach ($trs as $tr) {
echo $dom->saveXML($tr);
echo '<br>';
}
此程式碼使用 saveXML() 輸出每個
的實際 HTML 表示標籤,保留標籤及其內容。透過僅查詢那些
從
中提取特定資訊標籤,例如它們包含的鏈接,您可以使用進一步的 XPath 查詢或 DOM 導航技術來深入您需要的特定節點。
以上是PHP 的 DOMDocument 如何從表格中擷取並保留 HTML `` 標籤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!