Heim >Backend-Entwicklung >PHP-Problem >Worauf sollten Sie achten, wenn Sie Webinhalte in PHP abrufen?
Hinweise zum Abrufen von Webinhalten mit PHP
1 Das Netzwerk macht Fehler und jeder Fehler ist möglich. Beispielsweise ist der Computer ausgefallen, das Netzwerkkabel ist nicht angeschlossen, der Domänenname ist falsch, das Netzwerk läuft ab, die Seite ist verschwunden, die Website springt, der Dienst ist gesperrt, die Host-Auslastung reicht nicht aus...
2. Der Server hat Einschränkungen hinzugefügt, die nur gängigen Browsern erlauben
3. Der Server hat Anti-Hotlinking-Einschränkungen hinzugefügt
4. Manchen Websites ist es egal Ist ein Accept-Encoding-Header in Ihrer HTTP-Anfrage oder nicht? Was ist der konkrete Inhalt? Wie dem auch sei, ich werde Ihnen immer den komprimierten Inhalt senden
5. URL-Links sind alle möglichen seltsamen, auch solche mit chinesischen Schriftzeichen , und einige verfügen sogar über Wagenrücklauf und Zeilenvorschub
6. Einige Websites haben einen Content-Type im HTTP-Header, und es gibt mehrere Content-Types auf der Webseite. Was noch empörender ist Jeder Inhaltstyp ist anders. Das Unverschämtste ist, dass diese Inhaltstypen nicht im Text verwendet werden, was zu verstümmelten Zeichen führt Es dauert viel Zeit, Tausende von Seiten zu analysieren.
Holen Sie es sich mit der PHP-WebinhaltsmethodeMethode 1. Verwenden Sie file_get_contents Methode zum Implementieren von
$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";
$html = file_get_contents($url);
//如果出现中文乱码使用下面代码
//$getcontent = iconv("gb2312", "utf-8",$html);
echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>";
$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$html = curl_exec($ch);
curl_close($ch);
echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>";
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
<head><title>Object moved</title></head>
<body><h1>Object Moved</h1>This object may be found <a href="some link." rel="external nofoll
Empfohlenes Tutorial:
Das obige ist der detaillierte Inhalt vonWorauf sollten Sie achten, wenn Sie Webinhalte in PHP abrufen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!