Heim > Artikel > Backend-Entwicklung > PHP implementiert Methoden und Fehlerbehandlung zum Crawlen von HTTPS-Inhalten
Bei meiner Recherche zur Hacker News API bin ich kürzlich auf ein HTTPS-Problem gestoßen. Da auf alle Hacker News-APIs über das verschlüsselte HTTPS-Protokoll zugegriffen wird, das sich vom normalen HTTP-Protokoll unterscheidet, tritt bei Verwendung der Funktion file_get_contents() in PHP zum Abrufen der in der API bereitgestellten Daten ein Fehler auf. Der verwendete Code lautet wie folgt :
<?php $data = file_get_contents("https://www.liqingbo.cn/son?print=pretty"); ......
Beim Ausführen des obigen Codes wird die folgende Fehlermeldung angezeigt:
PHP Warning: file_get_contents(): Unable to find the wrapper "https" - did you forget to enable it when you configured PHP?
Das Folgende ist ein Screenshot:
Warum tritt dieser Fehler auf?
Nachdem ich im Internet gesucht habe, habe ich festgestellt, dass dieser Fehler sehr direkt ist. Dies liegt daran, dass in der PHP-Konfigurationsdatei kein Parameter aktiviert ist / Für das Element ;extension=php_openssl.dll in bin/php.ini muss das vorangehende Semikolon entfernt werden. Sie können das folgende Skript verwenden, um die Konfiguration Ihrer PHP-Umgebung zu überprüfen:
$w = stream_get_wrappers();
echo 'openssl: ', extension_loaded ('openssl ') ? 'yes':'no', "n";
echo 'http wrapper: ', in_array('http', $w) ? 'yes':'no', "n";
echo 'https wrapper: ', in_array('https', $w) ? 'yes':'no', "n";
echo 'wrappers: ', var_dump($ w);
Beim Ausführen des obigen Skriptausschnitts ist das Ergebnis auf meinem Computer:
openssl: no http wrapper: yes https wrapper: no wrappers: array(10) { [0]=> string(3) "php" [1]=> string(4) "file" [2]=> string(4) "glob" [3]=> string(4) "data" [4]=> string(4) "http" [5]=> string(3) "ftp" [6]=> string(3) "zip" [7]=> string(13) "compress.zlib" [8]=> string(14) "compress.bzip2" [9]=> string(4) "phar" }
Alternativen
Finden Sie den Fehler und beheben Sie ihn. Das Schwierige ist, dass Sie den Fehler nicht beheben können, nachdem Sie ihn gefunden haben. Ich wollte diese Skriptmethode ursprünglich auf dem Remote-Host installieren, konnte aber die PHP-Konfiguration des Remote-Hosts nicht ändern. Das Ergebnis war, dass ich diese Lösung nicht verwenden konnte, aber wir können uns nicht an einen Baum hängen. Dieser Weg funktioniert nicht. Gibt es einen anderen Weg?
Eine weitere Funktion, die ich häufig zum Abrufen von Inhalten in PHP verwende, ist curl. Sie ist leistungsfähiger als file_get_contents() und bietet viele optionale Parameter. Für das Problem des Zugriffs auf HTTPS-Inhalte müssen wir folgende CURL-Konfigurationsparameter verwenden:
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
Sie können aus der Semantik erkennen, dass es sich um Ignorieren/ handelt. springen SSL-Sicherheitsüberprüfung bestanden. Vielleicht ist das keine gute Idee, aber für gewöhnliche Szenarien reicht es aus.
Das Folgende ist eine von Curl gekapselte Funktion, die auf HTTPS-Inhalte zugreifen kann:
function getHTTPS($url) { $ch = curl_init(); curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE); curl_setopt($ch, CURLOPT_HEADER, false); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_REFERER, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE); $result = curl_exec($ch); curl_close($ch); return $result; }
Das Obige ist der gesamte Prozess des Erhaltens von https Inhalt in PHP Es ist sehr einfach und praktisch. Ich empfehle es Freunden, die die gleichen Projektanforderungen haben.