ホームページ  >  記事  >  バックエンド開発  >  PHP + JavaScript が Web コンテンツをクロールする方法の詳細な紹介

PHP + JavaScript が Web コンテンツをクロールする方法の詳細な紹介

零到壹度
零到壹度オリジナル
2018-04-11 17:27:386029ブラウズ

この記事で共有する内容は、PHP+JavaScript が Web コンテンツをクロールする方法についての詳細な紹介です。必要な友人はそれを参照できます

php+js が Web コンテンツをクロールする方法を最初に参照してください。次の効果を達成するには

PHP + JavaScript が Web コンテンツをクロールする方法の詳細な紹介PHP + JavaScript が Web コンテンツをクロールする方法の詳細な紹介

?

Web ページのコンテンツをクロールできるのは Python だけだといつも思っていました。それは、Python 自体に Web ページのクロールに非常に便利なライブラリがたくさんあるからです。しかし、PHP+js を使用する方法も非常に便利で、必要なものを入手できます。 . Web コンテンツなので、複雑である必要はありません。

まず、Web サイト全体の HTML を取得するリクエストをシミュレートするために PHP が必要です

  // 允许所有域访问
  header("Access-Control-Allow-Origin: *");
  / 接收一个参数,参数名叫parm
  $parm=$_GET['mod'];
  if (empty($parm)) {  
    $url = 'http://m.80s.tw/';//PHP + JavaScript が Web コンテンツをクロールする方法の詳細な紹介
    $html = file_get_contents($url);
}else{  
  $url = 'http://m.80s.tw/'.$parm;    
  $html = file_get_contents($url);
} 
    preg_match("/<body[^>]*?>(.*\s*?)<\/body>/is",$html,$match1);//正则匹配body里面的内容
    echo $match1[0];//输出网页
注: file_get_contents エラーが発生した場合は、php.ini で extension=php_openssl.dll を見つけてオンにしてみてください。大丈夫です

その後、それを取得するのがフロントエンドですデータが処理されます

まず非同期リクエストを書きます

$.ajax({ 
        type:&#39;get&#39;,
        url: &#39;.././admin/test.php&#39;,
        success: function(data) {
        console.log(data)//可以看到获取的HTML,很简单吧,很兴奋吧
        }
    });

HTMLを取得したら、あとは何でもできます

このHTMLはどうやって使うのですか?これは問題ですか?いいえ
うわー

これでウェブコンテンツのクロールに関するチュートリアルは終わりです。理解できない場合は、メッセージを残してください。

以上がPHP + JavaScript が Web コンテンツをクロールする方法の詳細な紹介の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。