Maison  >  Article  >  développement back-end  >  Introduction détaillée à la façon dont PHP+JavaScript explore le contenu Web

Introduction détaillée à la façon dont PHP+JavaScript explore le contenu Web

零到壹度
零到壹度original
2018-04-11 17:27:386032parcourir

Le contenu de cet article est une introduction détaillée à la façon dont PHP+JavaScript explore le contenu Web. Il a une certaine valeur de référence. Les amis dans le besoin peuvent s'y référer

php. +js explore le contenu Web : jetons d'abord un coup d'œil à l'effet

Introduction détaillée à la façon dont PHP+JavaScript explore le contenu WebIntroduction détaillée à la façon dont PHP+JavaScript explore le contenu Web

Comment faire ?

Nous avons toujours pensé que seul Python pouvait explorer le contenu Web. En effet, Python lui-même possède de nombreuses bibliothèques très pratiques pour explorer les pages Web. Cependant, notre méthode d'utilisation de PHP+js est également très pratique et peut le faire. être obtenu. Le contenu Web que nous voulons, et cela ne doit pas être compliqué.

Nous avons d'abord besoin de PHP pour simuler une requête afin d'obtenir le code HTML de l'ensemble du site Web

  // 允许所有域访问
  header("Access-Control-Allow-Origin: *");
  / 接收一个参数,参数名叫parm
  $parm=$_GET['mod'];
  if (empty($parm)) {  
    $url = 'http://m.80s.tw/';//Introduction détaillée à la façon dont PHP+JavaScript explore le contenu Web
    $html = file_get_contents($url);
}else{  
  $url = 'http://m.80s.tw/'.$parm;    
  $html = file_get_contents($url);
} 
    preg_match("/<body[^>]*?>(.*\s*?)<\/body>/is",$html,$match1);//正则匹配body里面的内容
    echo $match1[0];//输出网页
Remarque : si vous rencontrez une erreur file_get_contents, veuillez essayer de trouver extension=php_openssl .dll dans php.ini C'est OK de l'activer

Ensuite, le front-end récupère les données à traiter

Écrivez d'abord une requête asynchrone

$.ajax({ 
        type:&#39;get&#39;,
        url: &#39;.././admin/test.php&#39;,
        success: function(data) {
        console.log(data)//可以看到获取的HTML,很简单吧,很兴奋吧
        }
    });

Après avoir obtenu le HTML, on peut faire ce qu'on veut

Comment utiliser ce HTML ? Est-ce un problème ? Non
        //首先创建一个容器
        var p = document.createElement(&#39;p&#39;);        
        // 把整个html的字符串存到这个p节点里
        p.innerHTML = data;        
        //然后就可以对p一顿检查了
        //比如获取类list_mov_title下所有的a标签
        var list = p.querySelectorAll(&#39;.list_mov_title a&#39;);        
        //赶紧打印出来看一下
        console.log(list)        
        //想要的东西都在吧
        //然后就把想要的东西往自己的页面里面塞吧

C'est la fin d'un tutoriel sur l'exploration de contenu Web. Si vous vous sentez éclairé, veuillez le transmettre. Si vous ne comprenez pas, veuillez laisser un message

.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn