首页 >后端开发 >php教程 >这种正则表达式怎么写?求高手解答!

这种正则表达式怎么写?求高手解答!

WBOY
WBOY原创
2016-06-23 14:39:401049浏览

有一个网页中的代码如下:

<span class="1">      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div></span><div class="2">      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div></div><div class="3">      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div></div><span class="4">      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div></span>...

大家注意到没有 class="1",class="2",class="3",...是有规律的,但是前面的标签没有规律,有时是span,有时是div,我想要的是用php如何写正则表达式获取class="1",class="2",class="3",...的内容,正则表达式这方面学的不好,试了半天都写不出来,求高手解答!


回复讨论(解决方案)

html或xml的东西有专门的dom api,特别是标签嵌套的html,尽量不要尝试用正则去获取,尤其是php的正则,这里涉及到正则的递归,即使php能有象其它语言提供的正则平衡组,也最好不要用。

\s+

(.*?)\s+
\s*(.*?)\s*\s*

谢谢两位的回答!

$s =<<< TXT<span class="1">      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div></span><div class="2">      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div></div><div class="3">      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div></div><span class="4">      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div></span>TXT;

方案1
include 'phpquery.php';$doc = phpQuery::newDocument($s);echo $doc->find('.1')->html();echo pq('.2')->html();
      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div>      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div>
方案2
include 'html_document.php';$p = new html_document( $s, 0);foreach($p->find('.\d') as $v) {    echo "$v->innerHTML\n";}
      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div>      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div>      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div>      <h3 class="title">testtesttesttesttesttestt</h3>      <div class="con">            <span>testtesttest</span><p>testtesttesttesttesttesttesttesttest</p>      </div>

感谢版主大大 ,手快早给结贴了

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn