>백엔드 개발 >PHP 튜토리얼 >PHP 스크래핑 코드에서 404 오류를 안정적으로 테스트하려면 어떻게 해야 합니까?

PHP 스크래핑 코드에서 404 오류를 안정적으로 테스트하려면 어떻게 해야 합니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-04 08:09:13921검색

How can I reliably test for 404 errors in my PHP scraping code?

PHP에서 404에 대한 URL 테스트: 종합 가이드

URL이 예기치 않은 404 오류를 반환하는 것을 발견하면 스크래핑 코드가 중단될 수 있습니다. 이 문제를 해결하려면 코드 시작 부분에 테스트를 구현하여 특정 상태 코드를 확인하는 것이 중요합니다.

fsockopen 접근 방식

추천되는 방법 중 하나는 fsockopen을 사용하는 것입니다. (). 그러나 URL에 리디렉션이 있는 경우 fsockopen()은 모든 값에 대해 빈 결과를 반환할 수 있습니다.

curl 접근 방식

보다 안정적인 접근 방식은 PHP의 컬 바인딩을 활용하는 것입니다. 컬을 사용하면 컬_getinfo()를 사용하여 HTTP 오류 코드를 검색할 수 있습니다. 예는 다음과 같습니다.

$handle = curl_init($url);
curl_setopt($handle, CURLOPT_RETURNTRANSFER, TRUE);

$response = curl_exec($handle);

$httpCode = curl_getinfo($handle, CURLINFO_HTTP_CODE);
if ($httpCode == 404) {
    // Handle 404 error here
}

curl_close($handle);

// Handle the response as needed

이 코드는 지정된 $url에 대한 컬 핸들을 초기화하고, 응답을 문자열로 반환하는 옵션을 설정하고, 요청을 실행하고, HTTP 코드를 검색합니다. 코드가 404이면 적절한 오류 처리 코드를 탐색합니다.

결론

curl의 cur_getinfo() 함수를 사용하면 컴퓨터에서 404 오류를 효과적으로 확인할 수 있습니다. PHP 스크래핑 코드로 다운스트림 중단을 방지하고 데이터 추출 프로세스의 안정성을 보장합니다.

위 내용은 PHP 스크래핑 코드에서 404 오류를 안정적으로 테스트하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.