部落客熱衷各種網路科技,常囉嗦,時常伴隨強迫症,常更新,覺得文章對你有幫助的可以關注我。 轉載請註明"深藍的鐮刀"
採集的核心還是正則匹配,正則我不是特別熟練,網上很多抓img標籤的方法,但是我的目的是抓到img中的src屬性的值,而且必須滿足貪心匹配,否則正則匹配會盡可能匹配長的字符串。總之,我花了不只5分鐘。 。 。不過相信正規熟練的同學真的只用5分鐘就能搞定這個採集了。
<?php class Crawler{ static private $output = array(); static private $web_content = ''; public function __construct($url){ if( false === self::$web_content = file_get_contents($url)){ self::$web_content = ''; } } static public function getImage(){ if( '' != self::$web_content ){ preg_match_all('/<img(.*?)src=\"([^\"]*)\"/i',self::$web_content,self::$output); } } static public function output(){ var_dump(self::$output); } static public function render(){ foreach(self::$output[2] as $o){ echo "<img src=\"$o\">"; } } } $crawler = new Crawler('http://blog.csdn.net/hornedreaper1988'); $crawler::getImage(); //$crawler::output(); $crawler::render();
以上就介紹了花5分鐘用php做圖片採集器,包含了方面的內容,希望對PHP教學有興趣的朋友有幫助。