이 기사의 예에서는 PHP에서 file_get_contents를 사용하여 중국어로 왜곡된 웹페이지를 크롤링하는 방법을 설명합니다. 참고할 수 있도록 모든 사람과 공유하세요. 구체적인 방법은 다음과 같습니다.
file_get_contents 함수는 원래 PHP와 함께 제공되는 매우 뛰어난 로컬 및 원격 파일 작업 함수입니다. 이를 사용하면 아무런 노력 없이 원격 데이터를 직접 다운로드할 수 있지만 웹 페이지를 읽는 데 사용할 때 몇 가지 문제가 발생합니다. 페이지가 깨졌습니다. 여기에는 귀하를 위한 구체적인 솔루션이 요약되어 있습니다.
인터넷상의 친구들에 따르면, 그 이유는 서버가 GZIP 압축을 켰기 때문일 수 있습니다. 다음은 내 웹사이트의 헤더 정보를 확인하기 위해 Firebug를 사용하기 위한 것입니다. 요청 헤더 정보는 다음과 같습니다.
해결책은 상대적으로 간단합니다. file_get_contents 대신 컬을 사용하여 얻은 다음 컬 구성 매개변수에 하나를 추가하는 것입니다.
오늘 file_get_contents를 이용해 사진을 캡쳐했는데 처음에는 이 문제를 인지하지 못했고, 이를 찾는데 많은 노력이 필요했습니다.
내장된 zlib 라이브러리를 사용하세요. 서버에 zlib 라이브러리가 설치되어 있는 경우 다음 코드를 사용하면 잘못된 코드 문제를 쉽게 해결할 수 있습니다.
이 기사가 모든 사람의 PHP 프로그래밍 설계에 도움이 되기를 바랍니다.