Heim  >  Artikel  >  Backend-Entwicklung  >  php 关于循环的问题!(采集网页内容)

php 关于循环的问题!(采集网页内容)

WBOY
WBOYOriginal
2016-06-23 13:47:591198Durchsuche

我在做论坛内容采集小程序,
本来是这样挑战网页采集的
if  ($_GET[id] $url="http://bbs.misranim.com/thread-".$_GET[id]."-1-1.html";

但是为了方便 我用了while循环 这样
$p=0;
while($p $url="http://bbs.misranim.com/thread-".$p."-1-1.html";
$p++;

问题就出现了,每次遇到被删除的空页面 他也会内容采集到数据库内
用if  ($_GET[id] 用了while 或者 for循环遇到被删除的空页面就出现这样的问题

图:遇到空页面就直接把上一页内容复制进去,比如 第13个帖子有内容,不过第14到17个帖子是被删除的空页面,它就会把13个帖子的内容加到这些里面去,后面也差不多!



用if  ($_GET[id] 13个帖子后面还几个都没有内容,所以直接跳过去,到第22个帖子 这样

我就想要这样的效果

用的是
 if (strlen($txt) > 5)//内容大与5个字符采集到数据库
{     
     $db->insert("INSERT INTO bbs_caiji (col_date,title,txt,url,type,source) VALUES ('".$col_date."','".$title1."','".$txt."','".$url."','BBS','misranim')");
}


为什么用while和for循环就出现这种问题呢?


回复讨论(解决方案)

打错字了,,第一行是跳转 不是挑战

应该不会出现你说的现象

代?不完整,只看提供的代?是?有??的。

每次循?後,都把$txt清?空??。

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn