首頁  >  文章  >  後端開發  >  如何使用 DOMDocument 和 XPath 從特定 HTML 標籤中提取文字?

如何使用 DOMDocument 和 XPath 從特定 HTML 標籤中提取文字?

Linda Hamilton
Linda Hamilton原創
2024-10-31 13:14:20502瀏覽

How to Extract Text from Specific HTML Tags Using DOMDocument and XPath?

使用PHP 的DOMDocument 和XPath 解析HTML

嘗試使用PHP 的DOMDocument 解析問題是在以下標籤中尋找一個常見標籤特定文本特定的課程。在這種情況下,單獨使用 DOMDocument::getElementsByTagName 可能不夠。

要擷取目標類別標籤內的特定文本,建議使用 DOMDocument 和 DOMXPath 的替代方法。 DOMXPath 允許強大的 XPath 查詢根據元素的屬性和結構來定位元素。

考慮以下 HTML:

<div class="main">
    <div class="text">
    Capture this text 1
    </div>
</div>

<div class="main">
    <div class="text">
    Capture this text 2
    </div>
</div>

要擷取

中的文字class="text" 的標籤是
的後代。 class="main" 的標籤,請依照以下步驟操作:
php
$html = <<loadHTML($html);

$xpath = new DOMXPath($dom);

$tags = $xpath->query('//div[@class="main"]/div[@class="text"]');
foreach ($tags as $tag) {
    var_dump(trim($tag->nodeValue));
}

此程式碼片段將輸出:

string 'Capture this text 1' (length=19)
string 'Capture this text 2' (length=19)

透過利用DOMDocument 和DOMXPath,您可以精確地定位和檢索其中的元素HTML 結構,即使在處理特定的類別層次結構和內容要求時也是如此。

以上是如何使用 DOMDocument 和 XPath 從特定 HTML 標籤中提取文字?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn