Maison >développement back-end >tutoriel php >花5分钟用php做个图片采集器

花5分钟用php做个图片采集器

WBOY
WBOYoriginal
2016-08-08 09:30:291228parcourir

博主热衷各种互联网技术,常啰嗦,时常伴有强迫症,常更新,觉得文章对你有帮助的可以关注我。 转载请注明"深蓝的镰刀"


采集的核心还是正则匹配,正则我不是特别熟练,网上很多抓img标签的方法,但是我的目的是抓到img中的src属性的值,而且必须满足贪心匹配,否则正则匹配会尽可能匹配长的字串。总之,我花了不止5分钟。。。不过相信正则熟练的同学真的只用5分钟就能搞定这个采集了。

<?php class Crawler{
    static private $output = array();

    static private $web_content = &#39;&#39;;

    public function __construct($url){
       if( false === self::$web_content = file_get_contents($url)){
            self::$web_content = &#39;&#39;;
        }
    }
    static public function getImage(){
       if( &#39;&#39; != self::$web_content ){
            preg_match_all(&#39;/<img(.*?)src=\"([^\"]*)\"/i&#39;,self::$web_content,self::$output);
        }
    }

    static public function output(){
        var_dump(self::$output);
    }

    static public function render(){
        foreach(self::$output[2] as $o){
            echo "<img  src=\"$o\" alt="花5分钟用php做个图片采集器" >";
        }
    }

}

$crawler = new Crawler('http://blog.csdn.net/hornedreaper1988');
$crawler::getImage();
//$crawler::output();
$crawler::render();

以上就介绍了花5分钟用php做个图片采集器,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn