首页 >后端开发 >php教程 >如何使用 DOMDocument 和 XPath 从特定 HTML 标签中提取文本？

如何使用 DOMDocument 和 XPath 从特定 HTML 标签中提取文本？

Linda Hamilton原创: 2024-10-31 13:14:20684浏览

How to Extract Text from Specific HTML Tags Using DOMDocument and XPath?

使用 PHP 的 DOMDocument 和 XPath 解析 HTML

尝试使用 PHP 的 DOMDocument 解析 HTML 时，一个常见问题是在以下标签中查找特定文本特定的课程。在这种情况下，单独使用 DOMDocument::getElementsByTagName 可能不够。

要捕获目标类标签内的特定文本，建议使用 DOMDocument 和 DOMXPath 的替代方法。 DOMXPath 允许强大的 XPath 查询根据元素的属性和结构来定位元素。

考虑以下 HTML：

<div class="main">
    <div class="text">
    Capture this text 1
    </div>
</div>

<div class="main">
    <div class="text">
    Capture this text 2
    </div>
</div>

要检索

中的文本class="text" 的标签是

的后代。 class="main" 的标签，按照以下步骤操作：

php
$html = <<loadHTML($html);

$xpath = new DOMXPath($dom);

$tags = $xpath->query('//div[@class="main"]/div[@class="text"]');
foreach ($tags as $tag) {
    var_dump(trim($tag->nodeValue));
}

此代码片段将输出：

string 'Capture this text 1' (length=19)
string 'Capture this text 2' (length=19)

通过利用 DOMDocument 和 DOMXPath，您可以准确地定位和检索其中的元素HTML 结构，即使在处理特定的类层次结构和内容要求时也是如此。

以上是如何使用 DOMDocument 和 XPath 从特定 HTML 标签中提取文本？的详细内容。更多信息请关注PHP中文网其他相关文章！

php html for using class this issue

声明：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Why Does My PHP Code Convert Milliseconds to the Wrong Date?下一篇：Is MVC Still the Best Choice for Web Applications?

查看更多