Heim  >  Artikel  >  Backend-Entwicklung  >  php抓取网页图片_PHP教程

php抓取网页图片_PHP教程

WBOY
WBOYOriginal
2016-07-13 10:37:21849Durchsuche

php抓取网页图片

PHP是一门很容易上手的Web编程语言。PHP学习成本很低,能够迅速开发各种Web应用,是一个很优秀的工具。
尽管很多人觉得PHP缺点很多,quick and dirty 之类的,但是“这个世界上只有两种编程语言,一种是饱受争议的,一种是没人用的”,不是吗?只要能够把事情做好的工具,就是好工具。PHP就是这么一个优秀的语言工具。

<?php
header('content-type:text/html;charset=utf-8');
 set_time_limit(0);//抓取不受时间限制
 if($_POST['Submit']=="开始抓取"){
  $URL=$_POST['link'];
  get_pic($URL);
 }            
 function get_pic($pic_url) {
  //获取图片二进制流
  $data=CurlGet($pic_url);
  //利用正则表达式得到图片链接
  $pattern_src1 = '/<img .*?src\=\"(.*\.jpg).*? alt="php抓取网页图片_PHP教程" >/';//只匹配jpg格式的图片
  $pattern_src2 = '/<img .*?src\=\"(.*\.bmp).*? alt="php抓取网页图片_PHP教程" >/';//只匹配bmp格式的图片
  $pattern_src3 = '/<img .*?src\=\"(.*\.png).*? alt="php抓取网页图片_PHP教程" >/';//只匹配png格式的图片
  $pattern_src4 = '/<img .*?src\=\"(.*\.gif).*? alt="php抓取网页图片_PHP教程" >/';//只匹配gif格式的图片
  $num1 = preg_match_all($pattern_src1, $data, $match_src1);
  $num2 = preg_match_all($pattern_src2, $data, $match_src2);
  $num3 = preg_match_all($pattern_src3, $data, $match_src3);
  $num4 = preg_match_all($pattern_src4, $data, $match_src4);
  $arr_src1=$match_src1[1];//获得图片数组
  $arr_src2=$match_src2[1];
  $arr_src3=$match_src3[1];
  $arr_src4=$match_src4[1];
  echo '=============================================抓取开始=============================================<br />';
  get_name1($arr_src1);
  get_name1($arr_src2);
  get_name1($arr_src3);
  get_name1($arr_src4);
  get_name2($arr_src1);
  get_name2($arr_src2);
  get_name2($arr_src3);
  get_name2($arr_src4);
 
  echo '=============================================抓取结束=============================================<br />';
  return 0;
 }
 
 function get_name1($pic_arr){
  //图片编号和类型
  $pattern_type = '/.*\/(.*?)$/';
 
  foreach($pic_arr as $pic_item){//循环取出每幅图的地址
   $num = preg_match_all($pattern_type,$pic_item,$match_type);
   //以流的形式保存图片
   $write_fd = @fopen($match_type[1][0],"wb");
   echo "图片网址:http://blog.csdn.net/phpfenghuo/article/details/".$pic_item."<br />";
   @fwrite($write_fd, CurlGet($pic_item));
   @fclose($write_fd);
  }
  return 0;
 }
  function get_name2($pic_arr){
  //图片编号和类型
  $pattern_type = '/.*\/(.*?)$/';
 
  foreach($pic_arr as $pic_item){//循环取出每幅图的地址
   $num = preg_match_all($pattern_type,$pic_item,$match_type);
   //以流的形式保存图片
   $write_fd = @fopen($match_type[1][0],"wb");
   echo "图片网址:http://blog.csdn.net/phpfenghuo/article/details/".$_POST['link'].$pic_item."<br />";
   @fwrite($write_fd, CurlGet($_POST['link'].$pic_item));
   @fclose($write_fd);
  }
  return 0;
 }
 //抓取网页内容
 function CurlGet($url){
  $url=str_replace('&','&',$url);
  $curl = curl_init();
  curl_setopt($curl, CURLOPT_URL, $url);
  curl_setopt($curl, CURLOPT_HEADER, false);
 
  //curl_setopt($curl, CURLOPT_REFERER,$url);
  curl_setopt($curl, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; SeaPort/1.2; Windows NT 5.1; SV1; InfoPath.2)");
  curl_setopt($curl, CURLOPT_COOKIEJAR, 'cookie.txt');
  curl_setopt($curl, CURLOPT_COOKIEFILE, 'cookie.txt');
  curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
  curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 0);
  $values = curl_exec($curl);
  curl_close($curl);
  return $values;
 }    
?>
<html>
 <head>
 <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
  <title>网页图片抓取</title>
 </head>
 <body>
  
 </body>
</html>


www.bkjia.comtruehttp://www.bkjia.com/PHPjc/735897.htmlTechArticlephp抓取网页图片 PHP是一门很容易上手的Web编程语言。PHP学习成本很低,能够迅速开发各种Web应用,是一个很优秀的工具。 尽管很多人觉得...
Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn