Maison >développement back-end >tutoriel php >Prenez dix minutes pour comprendre le processus d'implémentation d'un robot en PHP
Informations textuelles
On essaie d'obtenir les informations du tableau Ici, on utilise l'horaire de cours d'un certain. école à la place :
Ensuite nous passerons au code :
a.php
<?php header( "Content-type:text/html;Charset=utf-8" ); $ch = curl_init(); $url ="表的链接"; curl_setopt ( $ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" ); curl_setopt($ch,CURLOPT_URL,$url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); $content=curl_exec($ch); preg_match_all("/<td rowspan=\"\d\">(.*?)<\/td>\n<td rowspan=\"\d\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td>(.*?)<\/td>\n<td>(.*?)<\/td><td>(.*?)<\/td>/",$content,$matchs,PREG_SET_ORDER);//匹配该表所用的正则 var_dump($matchs);
Alors exécutons-le :
L'horaire des cours a été obtenu avec succès
Acquisition d'images
Lien absolu
Prenons comme exemple la page d'accueil de Baidu Gallery
b.php
<?php header( "Content-type:text/html;Charset=utf-8" ); $ch = curl_init(); $url="http://image.baidu.com/"; curl_setopt ( $ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" ); curl_setopt($ch,CURLOPT_URL,$url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); $content=curl_exec($ch); $string=file_get_contents($url); preg_match_all("/<img ([^ alt="Prenez dix minutes pour comprendre le processus d'implémentation d'un robot en PHP" >]*)\s*src=('|\")([^'\"]+)('|\")/", $string,$matches); $new_arr=array_unique($matches[3]); foreach($new_arr as $key){ echo "<img src=$key alt="Prenez dix minutes pour comprendre le processus d'implémentation d'un robot en PHP" >"; }
Ensuite, nous obtenons ce qui suit page :
Lien relatif
La plupart des liens vers des images dans la galerie Baidu sont des liens absolus, donc lorsque nous rencontrons une page Web des images qui sont des liens relatifs au temps, comment devons-nous les gérer ? C'est en fait très simple, il suffit de changer la partie boucle en
Ensuite, nous pouvons également afficher l'image dans le navigateur
Merci d'avoir lu, j'espère ; Tout le monde en profite.
Tutoriel recommandé : "Tutoriel php"
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!