PHPマルチスレッドで美人画像を一括収集・ダウンロードするための実装コード（続き）

ホームページ

バックエンド開発

PHPチュートリアル

PHPマルチスレッドで美人画像を一括収集・ダウンロードするための実装コード（続き）_PHPチュートリアル

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jul 21, 2016 pm 03:09 PM

phpurlダウンロード個人的コードマッチ理由写真成し遂げるバッチの糸コレクション

個人的に考えられる影響の理由:
一致した画像の URL は有効な URL ではありません。記事では単純に相対パスかどうかを判断していますが、一部の URL は無効であるかどうかを判断するために新しい画像を追加します。本物の有効な URL

コードをコピーしますコードは次のとおりです:

/**
 * 
 *URL が有効かどうかを判断します 
 *@param $url string
 *@return boole 
*/
function relUrl($url){
 if(substr($url,0,4)=='http '){
 $array = get_headers($url,true);
 if(count($array)>0 && is_array($array)){
 if(preg_match('/200/', $array[0] )){
 unset($array);
 return true;
 }else{
 unset($array);
 return false;
 }
 }else{
 unset($array);
 return false;
 }
 } else{
 Return false;
}
}

主に get_headers 関数を使用して http リクエスト情報を取得し、サーバーの応答ステータス (200) を確認し、URL が本物で有効であるかどうかを判断します。

写真を収集するために再度テストしました

結果は以前よりも悪く、動作がさらに遅くなりました。

テストの理由は次のとおりです:

get_headers 関数は URL が本物で有効かどうかを判断できますが、非常に遅い URL リソースに遭遇した場合、get-heades リクエストには時間制限がないため、このスレッドは占有されてしまいます。
file_get_content 関数上記と同じ理由で、一部の遅い URL リソースが長時間占有されるため、ブロックの背後にあるプロセスが占有され、長時間のブロックにより CPU 使用率も増加します。
解決策
curl のマルチスレッドを使用すると、URL リソースが非常に遅い場合に、断固として諦めることができるため、効率が向上します。比較的高いはずです。「CURL の学習と応用 [マルチスレッド化]」を参照してください。もう一度テストしてみましょう。
コアコード:

コードをコピーしますコードは次のとおりです:

/**
     * curl 多线程
     *
     * @param array $array 并行网址
     * @param int $timeout 超时时间
     * @return mix
     */
public function Curl_http($array,$timeout='15'){
      $res = array();

      $mh = curl_multi_init();//创建多个curl语柄

      foreach($array as $k=>$url){
          $conn[$k]=curl_init($url);//初始化

          curl_setopt($conn[$k], CURLOPT_TIMEOUT, $timeout);//设置超时时间
          curl_setopt($conn[$k], CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 5.01; Windows NT 5.0)');
          curl_setopt($conn[$k], CURLOPT_MAXREDIRS, 7);//HTTp定向级别，7最高
          curl_setopt($conn[$k], CURLOPT_HEADER, false);//这里不要header，加块效率
          curl_setopt($conn[$k], CURLOPT_FOLLOWLOCATION, 1); // 302 redirect
          curl_setopt($conn[$k], CURLOPT_RETURNTRANSFER,1);//要求结果为字符串且输出到屏幕上
    curl_setopt($conn[$k], CURLOPT_HTTPGET, true);

          curl_multi_add_handle ($mh,$conn[$k]);
      }
       //防止死循环耗死cpu 这段是根据网上的写法
          do {
              $mrc = curl_multi_exec($mh,$active);//当无数据，active=true
          } while ($mrc == CURLM_CALL_MULTI_PERFORM);//当正在接受数据时
          while ($active and $mrc == CURLM_OK) {//当无数据时或请求暂停时，active=true
              if (curl_multi_select($mh) != -1) {
                  do {
                      $mrc = curl_multi_exec($mh, $active);
                  } while ($mrc == CURLM_CALL_MULTI_PERFORM);
              }
          }

      foreach ($array as $k => $url) {
            if(!curl_errno($conn[$k])){
            $data[$k]=curl_multi_getcontent($conn[$k]);//数据转换为array
            $header[$k]=curl_getinfo($conn[$k]);//返回http头信息
            curl_close($conn[$k]);//关闭语柄
            curl_multi_remove_handle($mh , $conn[$k]);   //释放资源
            }else{
            unset($k,$url);
            }
          }

          curl_multi_close($mh);

          return $data;

   }

//参数接收
$callback = $_GET['callback'];
$hrefs = $_GET['hrefs'];
$urlarray = explode(',',trim($hrefs,','));
$date = date('Ymd',time());
//实例化
$img = new HttpImg();
$stime = $img->getMicrotime();//开始时间

$data = $img->Curl_http($urlarray,'20');//リストデータ
mkdir('./img/'.$date,0777);
foreach ((array)$data as $k =>$v){
preg_match_all("/(href|src)=(["|']?)([^ "'>]+.(jpg|png|PNG|JPG|gif))2/ i", $v, $matches[$k]);

if(count($matches[$k][3])>0){
$dataimg = $img->Curl_http($matches[$ k][3],'20');//全画像データバイナリ
$j = 0;
foreach ((array)$dataimg as $kk=>$vv){
if($vv !='' ){
$rand = rand(1000,9999);
$basename = time()."_".$rand.".".jpg;//jpg形式ファイルとして保存
$fname = './ img /'.$date."/"."$basename";
file_put_contents($fname, $vv);
$j++;
echo "".$j." 番目の画像を作成します"."$fname"。 "
";
}else{
unset($kk,$vv);
}
}
}else{
unset($matches);
}
}
$etime = $img-> ; getMicrotime();//終了時刻
echo "time".($etime-$stime)."秒";
終了;

効果をテストします
PHPマルチスレッドで美人画像を一括収集・ダウンロードするための実装コード（続き）_PHPチュートリアル
基本的に、1秒で1枚の写真を収集するのに約260秒かかります。また、より多くの写真を撮影するほど、収集速度の利点が明らかになることがわかります。

ファイル名を見てみましょう。これは、同時に 10 枚の画像を生成できることを意味します。

20 秒のリクエスト時間制限により、一部の画像は生成後に明らかに不完全になります。つまり、画像リソースは 20 秒以内に完全に収集されません。この時間は自分で設定できます。

を追加することです。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

誇大広告を超えて：今日のPHPの役割の評価Apr 12, 2025 am 12:17 AM

PHPは、特にWeb開発の分野で、最新のプログラミングで強力で広く使用されているツールのままです。 1）PHPは使いやすく、データベースとシームレスに統合されており、多くの開発者にとって最初の選択肢です。 2）動的コンテンツ生成とオブジェクト指向プログラミングをサポートし、Webサイトを迅速に作成および保守するのに適しています。 3）PHPのパフォーマンスは、データベースクエリをキャッシュおよび最適化することで改善でき、その広範なコミュニティと豊富なエコシステムにより、今日のテクノロジースタックでは依然として重要になります。

PHPの弱い参照は何ですか、そしていつ有用ですか？Apr 12, 2025 am 12:13 AM

PHPでは、弱い参照クラスを通じて弱い参照が実装され、ガベージコレクターがオブジェクトの回収を妨げません。弱い参照は、キャッシュシステムやイベントリスナーなどのシナリオに適しています。オブジェクトの生存を保証することはできず、ごみ収集が遅れる可能性があることに注意する必要があります。

PHPで__invoke Magicメソッドを説明してください。Apr 12, 2025 am 12:07 AM

\ _ \ _ Invokeメソッドを使用すると、オブジェクトを関数のように呼び出すことができます。 1。オブジェクトを呼び出すことができるように\ _ \ _呼び出しメソッドを定義します。 2。$ obj（...）構文を使用すると、PHPは\ _ \ _ Invokeメソッドを実行します。 3。ロギングや計算機、コードの柔軟性の向上、読みやすさなどのシナリオに適しています。

同時性については、PHP 8.1の繊維を説明します。Apr 12, 2025 am 12:05 AM

繊維はPhp8.1で導入され、同時処理機能が改善されました。 1）繊維は、コルーチンと同様の軽量の並行性モデルです。 2）開発者がタスクの実行フローを手動で制御できるようにし、I/O集約型タスクの処理に適しています。 3）繊維を使用すると、より効率的で応答性の高いコードを書き込むことができます。

PHPコミュニティ：リソース、サポート、開発Apr 12, 2025 am 12:04 AM

PHPコミュニティは、開発者の成長を支援するための豊富なリソースとサポートを提供します。 1）リソースには、公式のドキュメント、チュートリアル、ブログ、LaravelやSymfonyなどのオープンソースプロジェクトが含まれます。 2）StackOverFlow、Reddit、およびSlackチャネルを通じてサポートを取得できます。 3）開発動向は、RFCに従うことで学ぶことができます。 4）コミュニティへの統合は、積極的な参加、コード共有への貢献、および学習共有への貢献を通じて達成できます。

PHP対Python：違いを理解しますApr 11, 2025 am 12:15 AM

PHP and Python each have their own advantages, and the choice should be based on project requirements. 1.PHPは、シンプルな構文と高い実行効率を備えたWeb開発に適しています。 2。Pythonは、簡潔な構文とリッチライブラリを備えたデータサイエンスと機械学習に適しています。

PHP：それは死にかけていますか、それとも単に適応していますか？Apr 11, 2025 am 12:13 AM

PHPは死にかけていませんが、常に適応して進化しています。 1）PHPは、1994年以来、新しいテクノロジーの傾向に適応するために複数のバージョンの反復を受けています。 2）現在、電子商取引、コンテンツ管理システム、その他の分野で広く使用されています。 3）PHP8は、パフォーマンスと近代化を改善するために、JITコンパイラおよびその他の機能を導入します。 4）Opcacheを使用してPSR-12標準に従って、パフォーマンスとコードの品質を最適化します。

PHPの未来：適応と革新Apr 11, 2025 am 12:01 AM

PHPの将来は、新しいテクノロジーの傾向に適応し、革新的な機能を導入することで達成されます。1）クラウドコンピューティング、コンテナ化、マイクロサービスアーキテクチャに適応し、DockerとKubernetesをサポートします。 2）パフォーマンスとデータ処理の効率を改善するために、JITコンパイラと列挙タイプを導入します。 3）パフォーマンスを継続的に最適化し、ベストプラクティスを促進します。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

メモ帳++7.3.1

使いやすく無料のコードエディター

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。