ホームページ  >  に質問  >  本文

Curl は Web ページをクロールしてデータを取得します

URL リンクが https://mbd.baidu.com/newspage/data/landingsuper?context={"nid":"news_4480296238548479181"}&n_type=0&p_from=1

Web ページ情報をクロールする方法

phpcn_u68041phpcn_u680412531日前1189

全員に返信(5)返信します

  • phpcn_u68041

    phpcn_u680412017-12-07 16:41:30

    ウェブサイトをクロールするにはcurlを使用してください。httpsに注意してください

    返事
    0
  • ringa_lee

    ringa_lee2017-12-07 14:20:17

    はい、1 階で述べたことは非常に完全です。これら 2 つのメソッドは通常、ページ情報を取得するために使用されます、file_get_contents とcurl request

    返事
    0
  • NULL

    NULL2017-12-07 13:23:13

    file_get_contents またはカールコードを使用できます:

    function getHTTPS($url) {
      $ch = curl_init();
      curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
      curl_setopt($ch, CURLOPT_HEADER, false);
      curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
      curl_setopt($ch, CURLOPT_URL, $url);
      curl_setopt($ch, CURLOPT_REFERER, $url);
      curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
      $result = curl_exec($ch);
      curl_close($ch);
      return $result;
    }


    返事
    2
  • phpcn_u68041

    curl のデフォルトのインストールでは https プロトコルがサポートされていません。これを追加する必要がありますか? curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false ); curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false );

    phpcn_u68041 · 2017-12-07 16:44:56
    NULL

    これは私がオンラインでコピーしたコードで、HTTPS Web ページのデータをクロールできることをテストして送信しました。

    NULL · 2017-12-12 10:18:17
  • キャンセル返事