>백엔드 개발 >PHP 튜토리얼 >웹 스크래핑 전에 PHP에서 404 오류를 효율적으로 확인할 수 있는 방법은 무엇입니까?

웹 스크래핑 전에 PHP에서 404 오류를 효율적으로 확인할 수 있는 방법은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-12-19 17:44:10654검색

How Can I Efficiently Check for 404 Errors in PHP Before Web Scraping?

PHP에서 404에 대한 URL을 테스트하는 쉬운 방법

404를 반환하는 URL로 인해 코드에 문제가 발생한다는 사실을 발견하는 것이 웹 스크래핑의 일반적인 문제점입니다. 이 문제를 효율적으로 해결하려면 URL에 404 응답이 있는지 확인하기 위해 코드 시작 부분에 테스트를 구현하는 것이 필수적입니다.

@fsockopen() 사용과 같은 제안은 리디렉션을 고려하지 않을 수 있지만 더 적합한 접근 방식은 다음을 사용하는 것입니다. 컬의 컬_getinfo() 함수. 방법은 다음과 같습니다.

// Initialize a cURL handle with the given URL
$handle = curl_init($url);
// Enable return of transfer as a string
curl_setopt($handle, CURLOPT_RETURNTRANSFER, TRUE);
// Get the response (HTML or data linked to the URL)
$response = curl_exec($handle);
// Check for 404 (file not found) response
$httpCode = curl_getinfo($handle, CURLINFO_HTTP_CODE);
// Handle 404
if ($httpCode == 404) {

    /* Perform your custom 404 handling here. */
}
// Close the curl session
curl_close($handle);
// Continue processing with the retrieved $response

이 코드를 통합하면 404 응답을 효과적으로 확인하여 코드에서 문제가 있는 URL을 건너뛰고 사용 가능한 URL로 진행할 수 있습니다.

위 내용은 웹 스크래핑 전에 PHP에서 404 오류를 효율적으로 확인할 수 있는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.