찾다

 >  Q&A  >  본문

Curl은 데이터를 찾기 위해 웹페이지를 크롤링합니다.

URL 링크가 https://mbd.baidu.com/newspage/data/landingsuper?context=%7B%22nid%22%3A%22news_4480296238548479181%22%7D&n_type=0&p_from=1이면 어떻게 되나요?

웹 정보 크롤링

phpcn_u68041phpcn_u680412533일 전1193

모든 응답(5)나는 대답할 것이다

  • phpcn_u68041

    phpcn_u680412017-12-07 16:41:30

    curl을 사용하여 웹사이트를 크롤링하세요. https에 주의하세요

    회신하다
    0
  • ringa_lee

    ringa_lee2017-12-07 14:20:17

    예, 1층에서 말씀드린 내용은 매우 완벽합니다. 이 두 가지 방법은 일반적으로 페이지 정보, file_get_contents 및 컬 요청을 얻는 데 사용됩니다.

    회신하다
    0
  • NULL

    NULL2017-12-07 13:23:13

    file_get_contents 또는 컬 코드를 사용할 수 있습니다:

    function getHTTPS($url) {
      $ch = curl_init();
      curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
      curl_setopt($ch, CURLOPT_HEADER, false);
      curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
      curl_setopt($ch, CURLOPT_URL, $url);
      curl_setopt($ch, CURLOPT_REFERER, $url);
      curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
      $result = curl_exec($ch);
      curl_close($ch);
      return $result;
    }


    회신하다
    2
  • phpcn_u68041

    컬의 기본 설치는 https 프로토콜을 지원하지 않습니다. 이것을 추가해야 합니까? 컬_setopt($ch, CURLOPT_SSL_VERIFYPEER, false ); 컬_setopt($ch, CURLOPT_SSL_VERIFYHOST, false );

    phpcn_u68041 · 2017-12-07 16:44:56
    NULL

    저는 컬에 대해 잘 모릅니다. 이것은 제가 인터넷에서 복사한 코드입니다. HTTPS 웹페이지 데이터를 크롤링할 수 있는지 테스트하여 여러분에게 보냈습니다.

    NULL · 2017-12-12 10:18:17
  • 취소회신하다