ホームページ >バックエンド開発 >PHPチュートリアル >PHP スクレイピング コードで 404 エラーを確実にテストするにはどうすればよいですか?

PHP スクレイピング コードで 404 エラーを確実にテストするにはどうすればよいですか?

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2024-12-04 08:09:13921ブラウズ

How can I reliably test for 404 errors in my PHP scraping code?

PHP での 404 の URL のテスト: 総合ガイド

URL が予期しない 404 エラーを返すことが判明すると、スクレイピング コードが中断される可能性があります。これに対処するには、コードの先頭にテストを実装して、この特定のステータス コードをチェックすることが不可欠です。

fsockopen アプローチ

推奨される方法の 1 つは、fsockopen を使用することです。 ()。ただし、URL にリダイレクトがある場合、fsockopen() はすべての値に対して空の結果を返す可能性があります。

curl アプローチ

より信頼性の高いアプローチは、PHP のカール バインディングを利用します。 curl では、curl_getinfo() を使用して HTTP エラー コードを取得できます。以下に例を示します。

$handle = curl_init($url);
curl_setopt($handle, CURLOPT_RETURNTRANSFER, TRUE);

$response = curl_exec($handle);

$httpCode = curl_getinfo($handle, CURLINFO_HTTP_CODE);
if ($httpCode == 404) {
    // Handle 404 error here
}

curl_close($handle);

// Handle the response as needed

このコードは、指定された $url のカール ハンドルを初期化し、応答を文字列として返すオプションを設定し、リクエストを実行して、HTTP コードを取得します。コードが 404 の場合は、適切なエラー処理コードに移動します。

結論

curl のcurl_getinfo() 関数を使用すると、コード内の 404 エラーを効果的にチェックできます。 PHP コードのスクレイピングにより、ダウンストリームの中断を防ぎ、データ抽出プロセスの安定性を確保します。

以上がPHP スクレイピング コードで 404 エラーを確実にテストするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。