Heim >Backend-Entwicklung >PHP-Tutorial >PHP多线程批量采集下载图片的实现代码

PHP多线程批量采集下载图片的实现代码

WBOY
WBOYOriginal
2016-07-25 08:44:171117Durchsuche
使用curl的多线程,另外curl可以设置请求时间,遇到很慢的url资源,可以果断的放弃,这样没有阻塞,另外有多线程请求,效率应该比较高
  1. /**
  2. * curl 多线程
  3. * @param array $array 并行网址
  4. * @param int $timeout 超时时间
  5. * @return mix
  6. */
  7. public function Curl_http($array,$timeout='15'){
  8. $res = array();
  9. $mh = curl_multi_init();//创建多个curl语柄
  10. foreach($array as $k=>$url){
  11. $conn[$k]=curl_init($url);//初始化
  12. curl_setopt($conn[$k], CURLOPT_TIMEOUT, $timeout);//设置超时时间
  13. curl_setopt($conn[$k], CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 5.01; Windows NT 5.0)');
  14. curl_setopt($conn[$k], CURLOPT_MAXREDIRS, 7);//HTTp定向级别 ,7最高
  15. curl_setopt($conn[$k], CURLOPT_HEADER, false);//这里不要header,加块效率
  16. curl_setopt($conn[$k], CURLOPT_FOLLOWLOCATION, 1); // 302 redirect
  17. curl_setopt($conn[$k], CURLOPT_RETURNTRANSFER,1);//要求结果为字符串且输出到屏幕上
  18. curl_setopt($conn[$k], CURLOPT_HTTPGET, true);
  19. curl_multi_add_handle ($mh,$conn[$k]);
  20. }
  21. //防止死循环耗死cpu 这段是根据网上的写法
  22. do {
  23. $mrc = curl_multi_exec($mh,$active);//当无数据,active=true
  24. } while ($mrc == CURLM_CALL_MULTI_PERFORM);//当正在接受数据时
  25. while ($active and $mrc == CURLM_OK) {//当无数据时或请求暂停时,active=true
  26. if (curl_multi_select($mh) != -1) {
  27. do {
  28. $mrc = curl_multi_exec($mh, $active);
  29. } while ($mrc == CURLM_CALL_MULTI_PERFORM);
  30. }
  31. }
  32. foreach ($array as $k => $url) {
  33. if(!curl_errno($conn[$k])){
  34. $data[$k]=curl_multi_getcontent($conn[$k]);//数据转换为array
  35. $header[$k]=curl_getinfo($conn[$k]);//返回http头信息
  36. curl_close($conn[$k]);//关闭语柄
  37. curl_multi_remove_handle($mh , $conn[$k]); //释放资源
  38. }else{
  39. unset($k,$url);
  40. }
  41. }
  42. curl_multi_close($mh);
  43. return $data;
  44. }
  45. //参数接收
  46. $callback = $_GET['callback'];
  47. $hrefs = $_GET['hrefs'];
  48. $urlarray = explode(',',trim($hrefs,','));
  49. $date = date('Ymd',time());
  50. //实例化
  51. $img = new HttpImg();
  52. $stime = $img->getMicrotime();//开始时间
  53. $data = $img->Curl_http($urlarray,'20');//列表数据
  54. mkdir('./img/'.$date,0777);
  55. foreach ((array)$data as $k=>$v){
  56. preg_match_all("/(href|src)=(["|']?)([^ "'>]+.(jpg|png|PNG|JPG|gif))\\2/i", $v, $matches[$k]);
  57. if(count($matches[$k][3])>0){
  58. $dataimg = $img->Curl_http($matches[$k][3],'20');//全部图片数据二进制
  59. $j = 0;
  60. foreach ((array)$dataimg as $kk=>$vv){
  61. if($vv !=''){
  62. $rand = rand(1000,9999);
  63. $basename = time()."_".$rand.".".jpg;//保存为jpg格式的文件
  64. $fname = './img/'.$date."/"."$basename";
  65. file_put_contents($fname, $vv);
  66. $j++;
  67. echo "创建第".$j."张图片"."$fname"."
    ";
  68. }else{
  69. unset($kk,$vv);
  70. }
  71. }
  72. }else{
  73. unset($matches);
  74. }
  75. }
  76. $etime = $img->getMicrotime();//结束时间
  77. echo "用时".($etime-$stime)."秒";
  78. exit;
复制代码

多线程, 下载图片, PHP


Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn