Home >php教程 >php手册 >如何抓取“深圳之窗”的新闻

如何抓取“深圳之窗”的新闻

WBOY
WBOYOriginal
2016-06-13 10:23:53837browse

最近不少网友来问我如何用PHP来抓取其他网站的新闻,开始我担心会侵权,一直没公开。但问的人太多了,这里我举个例子 ---- 如何抓取“深圳之窗”的新闻,仅供大家参考使用思路。请大家自觉,不要做违规的事。谢谢。
抓取“科技新闻”目录代码页(readNews.php):
$url = "http://news.szptt.net.cn/kjxw.phtml";
if(isset($url)&&$url!="") {
$str = implode("",file($url));
$str_ary = explode("

    ",$str);
    $str_ary = explode("",$str_ary[1]);
    for ($i=0; $iecho $str_ary[$i];
    }
    }
    ?>


    相关文章
    ? 如何抓取“深圳之窗”的新闻
    最近不少网友来问我如何用PHP来抓取其他网站的新闻,开始我担心会侵权,一直没公开。但问的人太多了,这里我举个例子 ---- 如何抓取“深圳之窗”的新闻,仅供大家参考使用思路。请大家自觉,不要做违规的事。谢谢。

    抓取“科技新闻”详细内容代码页(readNewsDetail.php):
    CTOHome.com 科技新闻频道
    /*
    * ctohome.com 深圳新闻
    */
    $url_ary = explode("/",$url);
    $url = $url_ary[count($url_ary)-2] . "/" . $url_ary[count($url_ary)-1];
    $url = "http://news.szptt.net.cn/" . $url;
    if(isset($url)&&$url!="") {
    $str = implode("",file($url));
    $str_ary = explode("echo "
    ";
    for ($i=4; $iecho "
    }
    echo "";
    }
    ?>
    抓取的方法要视不同的原代码而定,事前要仔细分析你要抓取的页的HTML原代码,然后找出规律,最后才写代码。IE对HTML语法的纠错功能很强,所以只要显示结果正确,抓取后的代码有些语法错误也没关系。
Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn
Previous article:php如何删除多级目录Next article:PHP3中文文档续1