<u>复制代码</u> 代码如下:<br> <br>//采集首页地址 <br>$url="http://emotion.pclady.com.cn/skills/"; <br>//获取页面代码 <br>$rs=file_get_contents($url); <br>//设置匹配正则 <br>//$fp=fopen("text.txt","a"); <br>//$fw=fwrite($fp,$rs); <br>//fclose($fp); <br>/*<i class="titles"><a>href="http://emotion.pclady.com.cn/skills/0903/376476.html" <br>target=_blank>留住你身边的好男人</a></i>*/ <br>$preg='/<i><a>]+\">(.*)/i'; <br>//进行正则搜索 <br>preg_match_all($preg,$rs,$title); <br>//计算标题数量 <br>$count=count($title[0]); <br>echo $count."<br>"; <br>//通过标题数量进行内容采集 <br>for ($i=0;$i<br>//设置内容页地址 <br>$pr='/</a><a>]+\">/isU'; <br>preg_match_all($pr,$title[0][$i],$jurl); <br>$substr=substr($jurl[0][0],9); <br>$curl=substr($substr,0,-18); <br>//获取内容页代码 <br>$c=file_get_contents($curl); <br>//设置内容页匹配正则 <br>$pc='/</a><a>]+\">/i'; <br>//进行正则匹配搜索 <br>preg_match($pc,$c,$content); <br>//输出标题 <br>echo $title[0][$i]."<br>"; <br>echo $title[1][$i]."<br>"; <br>$concount=count($content[0]); <br>echo $concount."<br>"; <br>echo $content[0][0]; <br>for ($j=0;$j<br>} <br>} <br>?> <br><br>通过检测,$c已经是内容页的数据流了,可是$pc这个的正则表达式为什么只匹配</a></i>