Heim  >  Artikel  >  Backend-Entwicklung  >  php实现递归抓取网页类实例_php技巧

php实现递归抓取网页类实例_php技巧

WBOY
WBOYOriginal
2016-05-16 20:18:171281Durchsuche

本文实例讲述了php实现递归抓取网页类的方法。分享给大家供大家参考。具体如下:

<&#63;php
class crawler{
 private $_depth=5;
 private $_urls=array();
 function extract_links($url)
 {
  if(!$this->_started){
   $this->_started=1;
   $curr_depth=0;
  }else{
   $curr_depth++;
  }
  if($curr_depth<$this->_depth)
  {
   $data=file_get_contents($url);
   if(preg_match_all('/((&#63;:http|https)://(&#63;:www.)*(&#63;:[a-zA-Z0-9_-]{1,15}.+[a-zA-Z0-9_]{1,}){1,}(&#63;:[a-zA-Z0-9_/.-&#63;&:%,!;]*))/',$data,$urls12))
   {
    foreach($urls12[0] as $k=>$v){
     $check=get_headers($v,1);
     if(strstr($v,$url) && $check[0]=='HTTP/1.1 200 OK' && !array_search($v,$this->_urls) && $curr_depth<$this->_depth){
      $this->_urls[]=$v;
      $this->extract_links($v);
     }
    }
   }
  }
  return $this->_urls;
 }
}
&#63;>

希望本文所述对大家的php程序设计有所帮助。

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn