PHP 解析 HTML 代码(不带正则表达式)
您有一个包含 HTML 代码的 PHP 变量,您需要提取不使用正则表达式的标题。
解决方案 1:PHP 文档对象模型(DOM)
此方法涉及使用 PHP 文档对象模型 (DOM) 来解析 HTML:
<?php $str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG'; $DOM = new DOMDocument; $DOM->loadHTML($str); // Get all H1 elements $items = $DOM->getElementsByTagName('h1'); // Display the text of each H1 element for ($i = 0; $i < $items->length; $i++) { echo $items->item($i)->nodeValue . "<br/>"; } ?>
这将输出标题中的文本:
T1 T2 T3
解决方案 2:正则表达式替换(对于介于标题)
如果目标是提取标题之间的内容,可以使用正则表达式,如下所示:
<?php $str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG'; $result = preg_replace("#<h1>.*?</h1>.*?</h1>#", "", $str); echo $result; ?>
这将输出标题之间的内容:
Lorem ipsum.The quick red fox...... jumps over the lazy brown FROG
以上是如何在没有正则表达式的情况下用 PHP 解析 HTML?的详细内容。更多信息请关注PHP中文网其他相关文章!