PHP HTML 解析:提取标题之间的文本
在 PHP 中,可以通过多种方法来完成 HTML 代码的解析。处理存储在变量中的 HTML 时,出于可靠性目的,建议避免使用正则表达式。
使用 PHP 文档对象模型 (DOM)
PHP DOM 提供了解析 HTML 的结构化方法:
$str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG'; $DOM = new DOMDocument; $DOM->loadHTML($str); $items = $DOM->getElementsByTagName('h1'); for ($i = 0; $i < $items->length; $i++) echo $items->item($i)->nodeValue . "<br/>";
这将输出:
T1 T2 T3
替代方法:正则表达式
如果所需的输出是标题之间的文本,则可以使用正则表达式:
$str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG'; echo preg_replace("#<h1.*?>.*?</h1>#", "", $str);
此表达式删除所有 HTML 标签并检索文本:
Lorem ipsum.The quick red fox...... jumps over the lazy brown FROG
以上是如何在 PHP 中提取 HTML 标题之间的文本?的详细内容。更多信息请关注PHP中文网其他相关文章!