首頁 >後端開發 >php教程 >关于preg_match_all的抓取,该如何解决

关于preg_match_all的抓取,该如何解决

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB原創: 2016-06-13 11:12:471086瀏覽

关于preg_match_all的抓取

<div><br /><h1>标题1</h1><br /><p>内容1</p><br /><p>内容2</p><br /><h1>标题2</h1><br /><p>内容1</p><br /><p>内容2</p><br /><p>内容3</p><br /><p>内容4</p><br /><h1>标题3</h1><br /><p>内容1</p><br /><p>内容2</p><br /><p>内容3</p><br /></div>

我要用preg_match_all()来循环获取从

到下一个

之前的内容即

标题1

内容1

内容2

－－－－－－－－－－－－

标题2

内容1

内容2

内容3

内容4

－－－－－－－－－－－－

标题3

内容1

内容2

内容3

我想过用

preg_match_all('/<h1>[\w\W]*<(h1|\/div)/U',$html, $out)

但这样抓，会隔一个就跳过，因为第二个的

已经被第一个用了。

------解决方案--------------------

preg_match_all('/<div>(.*)<\/div>/is', $str, $m);<br />$m = explode('<h1>', substr($m[1][0], 5));<br />foreach($m as $x)<br />    echo htmlspecialchars ("<h1>$x") . '<br/>';

陳述：

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

上一篇：一个字符指针定位的有关问题，请问上各位下一篇：怎样用php读取word2007，然后显示到网页下呢

看更多

关于preg_match_all的抓取,该如何解决

到下一个

之前的内容即

标题1

标题2

标题3

已经被第一个用了。

------解决方案--------------------
preg_match_all('/<div>(.*)<\/div>/is', $str, $m);<br />$m = explode('<h1>', substr($m[1][0], 5));<br />foreach($m as $x)<br /> echo htmlspecialchars ("<h1>$x") . '<br/>';

相關文章

关于preg_match_all的抓取,该如何解决

到下一个

之前的内容即

标题1

标题2

标题3

已经被第一个用了。 ------解决方案--------------------preg_match_all('/<div>(.*)<\/div>/is', $str, $m);<br />$m = explode('<h1>', substr($m[1][0], 5));<br />foreach($m as $x)<br /> echo htmlspecialchars ("<h1>$x") . '<br/>';

相關文章

已经被第一个用了。

------解决方案--------------------
preg_match_all('/<div>(.*)<\/div>/is', $str, $m);<br />$m = explode('<h1>', substr($m[1][0], 5));<br />foreach($m as $x)<br /> echo htmlspecialchars ("<h1>$x") . '<br/>';