PHP 中的 DOMDocument:解析和操作 HTML 文档
处理 HTML 文档时,DOM(文档对象模型)提供了结构化和文档内容的面向对象表示。 PHP 的 DOMDocument 类使我们能够在节点级别与 HTML 文档进行交互和修改。
要使用 DOMDocument 解析 HTML 文档,我们按照以下步骤操作:
- 创建一个 DOMDocument 对象并使用 loadHTML() 加载 HTML 内容。
- 使用 DOMXPath 查询和操作解析后的内容
在您的示例中,您想要提取所有
HTML 表中的标签并分析其内容。但是,您提供的代码从结果中剥离了 HTML 标签,这是不可取的。为了保留 HTML 标签,我们需要了解 DOMDocument 将整个 HTML 文档表示为分层树结构,其中代表各种元素(例如
或 标签)和文本的节点。$dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$trs = $xpath->query('//tr[@id="showContent"]');
foreach ($trs as $tr) {
echo $dom->saveXML($tr);
echo '<br>';
}
此代码使用 saveXML() 输出每个
的实际 HTML 表示标签,保留标签及其内容。通过仅查询那些
从
中提取特定信息标签,例如它们包含的链接,您可以使用进一步的 XPath 查询或 DOM 导航技术来深入到您需要的特定节点。
以上是PHP 的 DOMDocument 如何从表中提取并保留 HTML `` 标签?的详细内容。更多信息请关注PHP中文网其他相关文章!