博主热衷各种互联网技术,常啰嗦,时常伴有强迫症,常更新,觉得文章对你有帮助的可以关注我。 转载请注明"深蓝的镰刀"
采集的核心还是正则匹配,正则我不是特别熟练,网上很多抓img标签的方法,但是我的目的是抓到img中的src属性的值,而且必须满足贪心匹配,否则正则匹配会尽可能匹配长的字串。总之,我花了不止5分钟。。。不过相信正则熟练的同学真的只用5分钟就能搞定这个采集了。
<?php class Crawler{ static private $output = array(); static private $web_content = ''; public function __construct($url){ if( false === self::$web_content = file_get_contents($url)){ self::$web_content = ''; } } static public function getImage(){ if( '' != self::$web_content ){ preg_match_all('/<img(.*?)src=\"([^\"]*)\"/i',self::$web_content,self::$output); } } static public function output(){ var_dump(self::$output); } static public function render(){ foreach(self::$output[2] as $o){ echo "<img src=\"$o\">"; } } } $crawler = new Crawler('http://blog.csdn.net/hornedreaper1988'); $crawler::getImage(); //$crawler::output(); $crawler::render();
以上就介绍了花5分钟用php做个图片采集器,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。