使用 PHP 的 DOMDocument 解析 HTML
要使用 PHP 的 DOMDocument 从 HTML 中提取特定文本元素,利用 XPath 查询比单独依赖更有效在 DOMDocument::getElementsByTagName 上。 XPath 查询允许根据文档结构中的特定条件进行精确选择。
从嵌套 DIV 中捕获文本
提供的示例 HTML 包含嵌套
要捕获目标文本,可以使用 XPath 查询:
<code class="php">$xpath->query('//div[@class="main"]/div[@class="text"]');</code>
此查询选择所有
迭代和提取节点值
要访问实际的文本内容,可以迭代每个匹配元素及其节点值访问的属性:
<code class="php">foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }</code>
trim() 函数用于从提取的文本中删除任何前导或尾随空格。
执行输出
执行代码将输出以下内容:
string 'Capture this text 1' (length=19) string 'Capture this text 2' (length=19)
以上是如何使用 PHP 的 DOMDocument 和 XPath 从 HTML 中提取特定文本?的详细内容。更多信息请关注PHP中文网其他相关文章!