Maison >développement back-end >tutoriel php >Prenez dix minutes pour comprendre le processus d'implémentation d'un robot en PHP

Prenez dix minutes pour comprendre le processus d'implémentation d'un robot en PHP

烟雨青岚
烟雨青岚avant
2020-07-16 13:49:483736parcourir

Prenez dix minutes pour comprendre le processus d'implémentation d'un robot en PHP

Informations textuelles

On essaie d'obtenir les informations du tableau Ici, on utilise l'horaire de cours d'un certain. école à la place :

Prenez dix minutes pour comprendre le processus dimplémentation dun robot en PHP

Ensuite nous passerons au code :

a.php

 <?php  header( "Content-type:text/html;Charset=utf-8" ); 
$ch = curl_init();        $url ="表的链接";
        curl_setopt ( $ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
        curl_setopt($ch,CURLOPT_URL,$url);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);        $content=curl_exec($ch);
        preg_match_all("/<td rowspan=\"\d\">(.*?)<\/td>\n<td rowspan=\"\d\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td>(.*?)<\/td>\n<td>(.*?)<\/td><td>(.*?)<\/td>/",$content,$matchs,PREG_SET_ORDER);//匹配该表所用的正则
        var_dump($matchs);

Alors exécutons-le :

Prenez dix minutes pour comprendre le processus dimplémentation dun robot en PHP

L'horaire des cours a été obtenu avec succès

Acquisition d'images

Lien absolu

Prenons comme exemple la page d'accueil de Baidu Gallery
Prenez dix minutes pour comprendre le processus dimplémentation dun robot en PHP
b.php

  <?php  header( "Content-type:text/html;Charset=utf-8" );  


    $ch = curl_init();    $url="http://image.baidu.com/";
    curl_setopt ( $ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
    curl_setopt($ch,CURLOPT_URL,$url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);    $content=curl_exec($ch);    $string=file_get_contents($url); 
    preg_match_all("/<img ([^ alt="Prenez dix minutes pour comprendre le processus d'implémentation d'un robot en PHP" >]*)\s*src=(&#39;|\")([^&#39;\"]+)(&#39;|\")/", 
                    $string,$matches);    $new_arr=array_unique($matches[3]);     foreach($new_arr as $key){ 
        echo "<img  src=$key alt="Prenez dix minutes pour comprendre le processus d'implémentation d'un robot en PHP" >";
     }

Ensuite, nous obtenons ce qui suit page :
Prenez dix minutes pour comprendre le processus dimplémentation dun robot en PHP

Lien relatif

La plupart des liens vers des images dans la galerie Baidu sont des liens absolus, donc lorsque nous rencontrons une page Web des images qui sont des liens relatifs au temps, comment devons-nous les gérer ? C'est en fait très simple, il suffit de changer la partie boucle en
Prenez dix minutes pour comprendre le processus dimplémentation dun robot en PHP

Ensuite, nous pouvons également afficher l'image dans le navigateur

Merci d'avoir lu, j'espère ; Tout le monde en profite.

Tutoriel recommandé : "Tutoriel php"

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer