>  기사  >  백엔드 개발  >  PHP에서 크롤러를 구현하는 프로세스를 이해하는 데 10분 정도 소요됩니다.

PHP에서 크롤러를 구현하는 프로세스를 이해하는 데 10분 정도 소요됩니다.

烟雨青岚
烟雨青岚앞으로
2020-07-16 13:49:483705검색

PHP에서 크롤러를 구현하는 프로세스를 이해하는 데 10분 정도 소요됩니다.

텍스트 정보

여기에서는 대신 특정 학교의 수업 일정을 사용합니다.

PHP에서 크롤러를 구현하는 프로세스를 이해하는 데 10분 정도 소요됩니다.

다음 코드로 이동합니다.

a .php

 <?php  header( "Content-type:text/html;Charset=utf-8" ); 
$ch = curl_init();        $url ="表的链接";
        curl_setopt ( $ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
        curl_setopt($ch,CURLOPT_URL,$url);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);        $content=curl_exec($ch);
        preg_match_all("/<td rowspan=\"\d\">(.*?)<\/td>\n<td rowspan=\"\d\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td>(.*?)<\/td>\n<td>(.*?)<\/td><td>(.*?)<\/td>/",$content,$matchs,PREG_SET_ORDER);//匹配该表所用的正则
        var_dump($matchs);

그런 다음 실행해 보겠습니다.

PHP에서 크롤러를 구현하는 프로세스를 이해하는 데 10분 정도 소요됩니다.

수업 일정을 성공적으로 가져왔습니다.

사진 획득

절대 링크

바이두 갤러리 홈페이지를 예로 들어보겠습니다
PHP에서 크롤러를 구현하는 프로세스를 이해하는 데 10분 정도 소요됩니다.
b .php

  <?php  header( "Content-type:text/html;Charset=utf-8" );  


    $ch = curl_init();    $url="http://image.baidu.com/";
    curl_setopt ( $ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
    curl_setopt($ch,CURLOPT_URL,$url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);    $content=curl_exec($ch);    $string=file_get_contents($url); 
    preg_match_all("/<img ([^ alt="PHP에서 크롤러를 구현하는 프로세스를 이해하는 데 10분 정도 소요됩니다." >]*)\s*src=(&#39;|\")([^&#39;\"]+)(&#39;|\")/", 
                    $string,$matches);    $new_arr=array_unique($matches[3]);     foreach($new_arr as $key){ 
        echo "<img  src=$key alt="PHP에서 크롤러를 구현하는 프로세스를 이해하는 데 10분 정도 소요됩니다." >";
     }

그러면 다음 페이지가 표시됩니다.
PHP에서 크롤러를 구현하는 프로세스를 이해하는 데 10분 정도 소요됩니다.

상대 링크

바이두 갤러리의 사진 링크는 대부분 절대 링크이므로 상대 링크인 웹페이지 사진을 만나면 우리는 어떻게 처리해야 할까요? 사실 매우 간단합니다. 루프 부분을
PHP에서 크롤러를 구현하는 프로세스를 이해하는 데 10분 정도 소요됩니다.

로 변경하면 브라우저에서 이미지를 출력할 수도 있습니다.

읽어주셔서 감사합니다. 도움이 되셨으면 좋겠습니다.

추천 튜토리얼: "php 튜토리얼"

위 내용은 PHP에서 크롤러를 구현하는 프로세스를 이해하는 데 10분 정도 소요됩니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 csdn.net에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제