Heim  >  Artikel  >  Backend-Entwicklung  >  PHP implementiert Methoden und Fehlerbehandlung zum Crawlen von HTTPS-Inhalten

PHP implementiert Methoden und Fehlerbehandlung zum Crawlen von HTTPS-Inhalten

高洛峰
高洛峰Original
2016-10-20 14:41:07957Durchsuche

Bei meiner Recherche zur Hacker News API bin ich kürzlich auf ein HTTPS-Problem gestoßen. Da auf alle Hacker News-APIs über das verschlüsselte HTTPS-Protokoll zugegriffen wird, das sich vom normalen HTTP-Protokoll unterscheidet, tritt bei Verwendung der Funktion file_get_contents() in PHP zum Abrufen der in der API bereitgestellten Daten ein Fehler auf. Der verwendete Code lautet wie folgt :

<?php
$data = file_get_contents("https://www.liqingbo.cn/son?print=pretty");
......

Beim Ausführen des obigen Codes wird die folgende Fehlermeldung angezeigt:

PHP Warning:  file_get_contents(): Unable to find the wrapper "https" - did you forget to enable it when you configured PHP?

Das Folgende ist ein Screenshot:

PHP implementiert Methoden und Fehlerbehandlung zum Crawlen von HTTPS-Inhalten

Warum tritt dieser Fehler auf?

Nachdem ich im Internet gesucht habe, habe ich festgestellt, dass dieser Fehler sehr direkt ist. Dies liegt daran, dass in der PHP-Konfigurationsdatei kein Parameter aktiviert ist / Für das Element ;extension=php_openssl.dll in bin/php.ini muss das vorangehende Semikolon entfernt werden. Sie können das folgende Skript verwenden, um die Konfiguration Ihrer PHP-Umgebung zu überprüfen:

$w = stream_get_wrappers();

echo 'openssl: ', extension_loaded ('openssl ') ? 'yes':'no', "n";

echo 'http wrapper: ', in_array('http', $w) ? 'yes':'no', "n";

echo 'https wrapper: ', in_array('https', $w) ? 'yes':'no', "n";

echo 'wrappers: ', var_dump($ w);

Beim Ausführen des obigen Skriptausschnitts ist das Ergebnis auf meinem Computer:

openssl: no
http wrapper: yes
https wrapper: no
wrappers: array(10) {
  [0]=>
  string(3) "php"
  [1]=>
  string(4) "file"
  [2]=>
  string(4) "glob"
  [3]=>
  string(4) "data"
  [4]=>
  string(4) "http"
  [5]=>
  string(3) "ftp"
  [6]=>
  string(3) "zip"
  [7]=>
  string(13) "compress.zlib"
  [8]=>
  string(14) "compress.bzip2"
  [9]=>
  string(4) "phar"
}

Alternativen

Finden Sie den Fehler und beheben Sie ihn. Das Schwierige ist, dass Sie den Fehler nicht beheben können, nachdem Sie ihn gefunden haben. Ich wollte diese Skriptmethode ursprünglich auf dem Remote-Host installieren, konnte aber die PHP-Konfiguration des Remote-Hosts nicht ändern. Das Ergebnis war, dass ich diese Lösung nicht verwenden konnte, aber wir können uns nicht an einen Baum hängen. Dieser Weg funktioniert nicht. Gibt es einen anderen Weg?

Eine weitere Funktion, die ich häufig zum Abrufen von Inhalten in PHP verwende, ist curl. Sie ist leistungsfähiger als file_get_contents() und bietet viele optionale Parameter. Für das Problem des Zugriffs auf HTTPS-Inhalte müssen wir folgende CURL-Konfigurationsparameter verwenden:

curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);

Sie können aus der Semantik erkennen, dass es sich um Ignorieren/ handelt. springen SSL-Sicherheitsüberprüfung bestanden. Vielleicht ist das keine gute Idee, aber für gewöhnliche Szenarien reicht es aus.

Das Folgende ist eine von Curl gekapselte Funktion, die auf HTTPS-Inhalte zugreifen kann:

function getHTTPS($url) {
  $ch = curl_init();
  curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
  curl_setopt($ch, CURLOPT_HEADER, false);
  curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
  curl_setopt($ch, CURLOPT_URL, $url);
  curl_setopt($ch, CURLOPT_REFERER, $url);
  curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
  $result = curl_exec($ch);
  curl_close($ch);
  return $result;
}

Das Obige ist der gesamte Prozess des Erhaltens von https Inhalt in PHP Es ist sehr einfach und praktisch. Ich empfehle es Freunden, die die gleichen Projektanforderungen haben.


Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Vorheriger Artikel:PHP erhält http-HeaderNächster Artikel:PHP erhält http-Header