Heim > Artikel > Backend-Entwicklung > So verwenden Sie eine URL, um Webinhalte in PHP abzurufen
Es ist sehr praktisch, Webseiteninhalte basierend auf der URL in PHP abzurufen. Sie können die im System integrierte Funktion file_get_contents() übergeben und die URL übergeben, um den Inhalt der Webseite zurückzugeben So erhalten Sie den Inhalt der Baidu-Homepage:
<?php $html = file_get_contents('http://www.baidu.com/'); echo $html;
kann den Inhalt der Baidu-Homepage anzeigen. Diese Funktion ist jedoch nicht allmächtig, da einige Server diese Funktion deaktivieren oder vom Server abgelehnt werden weil bestimmte notwendige Parameter nicht an den Server übergeben werden:
<?php $html = file_get_contents('http://www.163.com/'); echo $html;
Dieser Code kann nicht den vollständigen Code der NetEase-Homepage abrufen und wird die folgende Seite zurückgeben anderer Methoden.
Hier stellen wir die cURL-Bibliothek von PHP vor, mit der Webseiten einfach und effektiv erfasst werden können. Sie müssen lediglich ein Skript ausführen und die von Ihnen gecrawlten Webseiten analysieren. Anschließend können Sie die gewünschten Daten programmgesteuert abrufen. Ganz gleich, ob Sie Teildaten aus einem Link abrufen, eine XML-Datei in eine Datenbank importieren oder einfach nur den Inhalt einer Webseite abrufen möchten: cURL ist eine leistungsstarke PHP-Bibliothek. Um es zu verwenden, müssen Sie es zuerst in der PHP-Konfigurationsdatei aktivieren. Möglicherweise benötigen Sie einige DLLs in Windows, um zu überprüfen, ob Curl aktiviert ist. Um zu überprüfen, ob es aktiviert ist, wird es unter „Geladene Erweiterungen“ angezeigt.
Das Folgende ist ein einfaches Beispiel für die Verwendung von Curl zum Abrufen von Webseitencode:
<?php $ch = curl_init(); $timeout = 10; // set to zero for no timeout curl_setopt ($ch, CURLOPT_URL,'http://www.163.com/'); curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt ($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.131 Safari/537.36'); curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout); $html = curl_exec($ch); echo $html;
Mit diesem Code können Sie den Inhalt der NetEase-Homepage ausgeben. Der hier rot markierte Code ist der Schlüssel, weil Er simuliert den Agenten des Browsers, sodass der Server denkt, dass der Browser darauf zugreift, und daher den richtigen HTML-Code zurückgibt.
Verwandte Empfehlungen:
php entsprechend der URL Webinhalt abrufen
Das obige ist der detaillierte Inhalt vonSo verwenden Sie eine URL, um Webinhalte in PHP abzurufen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!