


À quoi devez-vous faire attention lorsque vous obtenez du contenu Web en php ?
Remarques sur l'obtention de contenu Web avec PHP
1. Des erreurs réseau se produiront et toute erreur est possible. Par exemple, la machine est en panne, le câble réseau est déconnecté, le nom de domaine est erroné, le réseau expire, la page a disparu, le site Web saute, le service est banni, la charge de l'hôte n'est pas suffisante...
2. Le serveur a ajouté des restrictions. Autoriser uniquement les navigateurs courants à accéder
3. Le serveur a ajouté des restrictions anti-hotlinking
4. Certains sites Web ne se soucient pas de savoir s'il y en a. un en-tête Accept-Encoding dans votre requête HTTP ou non. Quel est le contenu spécifique ? Quoi qu'il en soit, je vous envoie toujours le contenu gzippé
5. Les liens URL sont toutes sortes de bizarreries, y compris celles avec des caractères chinois, et certains ont même un retour chariot et un saut de ligne
6. Un certain Certains sites Web ont un Content-Type dans l'en-tête HTTP, et il y a plusieurs Content-Types dans la page Web. Ce qui est encore plus scandaleux, c'est que chaque Content-Type. -Le type est différent. Le plus scandaleux est que ces types de contenu ne peuvent pas être utilisés dans le texte, ce qui entraîne des caractères tronqués
7. Le lien réseau est très lent. prend pour analyser des milliers de pages. Je vous suggère de prendre un bon repas
Obtenez-le avec la méthode de contenu Web PHP
Méthode 1. Utilisez la méthode file_get_contents pour implémentez
$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml"; $html = file_get_contents($url); //如果出现中文乱码使用下面代码 //$getcontent = iconv("gb2312", "utf-8",$html); echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>";
Méthode 2. Utilisez curl pour implémenter
$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml"; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); $html = curl_exec($ch); curl_close($ch); echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>"; curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
L'ajout de ce code signifie que si la requête est redirigée, vous pouvez accéder à la version finale page de requête, sinon le résultat de la requête affichera ce qui suit :
<head><title>Object moved</title></head> <body><h1 id="Object-nbsp-Moved">Object Moved</h1>This object may be found <a href="some link." rel="external nofoll
Tutoriel recommandé : Tutoriel vidéo PHP
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Télécharger la version Mac de l'éditeur Atom
L'éditeur open source le plus populaire

Version crackée d'EditPlus en chinois
Petite taille, coloration syntaxique, ne prend pas en charge la fonction d'invite de code

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Navigateur d'examen sécurisé
Safe Exam Browser est un environnement de navigation sécurisé permettant de passer des examens en ligne en toute sécurité. Ce logiciel transforme n'importe quel ordinateur en poste de travail sécurisé. Il contrôle l'accès à n'importe quel utilitaire et empêche les étudiants d'utiliser des ressources non autorisées.

Adaptateur de serveur SAP NetWeaver pour Eclipse
Intégrez Eclipse au serveur d'applications SAP NetWeaver.
