最近不少网友来问我如何用PHP来抓取其他网站的新闻,开始我担心会侵权,一直没公开。但问的人太多了,这里我举个例子 ---- 如何抓取“深圳之窗”的新闻,仅供大家参考使用思路。请大家自觉,不要做违规的事。谢谢。
抓取“科技新闻”目录代码页(readNews.php):
$url = "http://news.szptt.net.cn/kjxw.phtml";
if(isset($url)&&$url!="") {
$str = implode("",file($url));
$str_ary = explode("
",$str);
$str_ary = explode("",$str_ary[1]);
for ($i=0; $iecho $str_ary[$i];
}
}
?>
相关文章
? 如何抓取“深圳之窗”的新闻
最近不少网友来问我如何用PHP来抓取其他网站的新闻,开始我担心会侵权,一直没公开。但问的人太多了,这里我举个例子 ---- 如何抓取“深圳之窗”的新闻,仅供大家参考使用思路。请大家自觉,不要做违规的事。谢谢。
抓取“科技新闻”详细内容代码页(readNewsDetail.php):
CTOHome.com 科技新闻频道
/*
* ctohome.com 深圳新闻
*/
$url_ary = explode("/",$url);
$url = $url_ary[count($url_ary)-2] . "/" . $url_ary[count($url_ary)-1];
$url = "http://news.szptt.net.cn/" . $url;
if(isset($url)&&$url!="") {
$str = implode("",file($url));
$str_ary = explode("echo "";
for ($i=4; $iecho "}
echo "";
}
?>
抓取的方法要视不同的原代码而定,事前要仔细分析你要抓取的页的HTML原代码,然后找出规律,最后才写代码。IE对HTML语法的纠错功能很强,所以只要显示结果正确,抓取后的代码有些语法错误也没关系。
http://www.bkjia.com/PHPjc/532204.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/532204.htmlTechArticle最近不少网友来问我如何用PHP来抓取其他网站的新闻,开始我担心会侵权,一直没公开。但问的人太多了,这里我举个例子 ---- 如何抓取“...
Stellungnahme:Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn