>  기사  >  php教程  >  PHP 연구 노트: 컬을 통해 웹사이트 콘텐츠 수집

PHP 연구 노트: 컬을 통해 웹사이트 콘텐츠 수집

WBOY
WBOY원래의
2016-10-15 10:31:501296검색

컬에 관해서는 바이두 직접 해주세요. 사건은 제가 직접 가겠습니다.

먼저 컬 확장을 활성화하고 php.ini 파일에서 컬 확장을 활성화합니다. 즉, 확장명=php_curl.dll의 세미콜론을 취소합니다.

예: 컬을 사용하여 웹사이트 콘텐츠를 수집하고 txt 문서로 출력합니다.

목표 : 이 블로그 홈페이지를 캡쳐해서 문서로 출력

<span style="font-size: 18px;"><?<span style="color: #000000;">php
</span><span style="color: #800080;">$ch</span> = curl_init("http://www.cnblogs.com/jianqingwang/"<span style="color: #000000;">);
</span><span style="color: #800080;">$fp</span> = <span style="color: #008080;">fopen</span>("example_jianqingwang.txt", "w"<span style="color: #000000;">);

curl_setopt(</span><span style="color: #800080;">$ch</span>, CURLOPT_FILE, <span style="color: #800080;">$fp</span><span style="color: #000000;">);
curl_setopt(</span><span style="color: #800080;">$ch</span>, CURLOPT_HEADER, 0<span style="color: #000000;">);

curl_exec(</span><span style="color: #800080;">$ch</span><span style="color: #000000;">);
curl_close(</span><span style="color: #800080;">$ch</span><span style="color: #000000;">);
</span><span style="color: #008080;">fclose</span>(<span style="color: #800080;">$fp</span><span style="color: #000000;">);
</span>?></span>

효과:

예: 웹사이트 콘텐츠를 캡처하여 직접 출력

목표: http://www.cnblogs.com/jianqingwang/을 크롤링하고 직접 출력



// 1. 초기화
$ch = cur_init();
// 2. URL을 포함한 옵션 설정
curl_setopt($ch, CURLOPT_URL, "http://www.cnblogs.com/jianqingwang/");
curl_setopt( $ch, CURLOPT_RETURNTRANSFER, 0);//출력하지 않으려면 0으로 변경
curl_setopt($ch, CURLOPT_HEADER, 0);
// 3. 실행하고 HTML 문서 콘텐츠 가져오기
$output =curl_exec($ch);
// 4. 컬 핸들 해제
curl_close ($ ch);
?>

<span style="font-size: 18px;"> </span>

효과:

참고: 여기의 인터페이스는 CSS와 이미지 주소가 상대 경로이므로 이미지와 CSS가 유효하지 않기 때문에 약간 다릅니다.

예:

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.