Heim  >  Artikel  >  PHP crawlt HTTPS-Websiteinhalte

PHP crawlt HTTPS-Websiteinhalte

PHP中文网
PHP中文网Original
2017-12-15 11:34:554165Durchsuche

Im Gegensatz zum normalen HTTP-Protokoll tritt bei Verwendung der Funktion file_get_contents() in PHP zum Abrufen der in der API bereitgestellten Daten ein Fehler auf.

Das liegt daran, dass in der PHP-Konfigurationsdatei kein Parameter aktiviert ist. Er befindet sich in /apache/bin/php.ini; Sie müssen die vorherige Version ändern das Semikolon. Sie können das folgende Skript verwenden, um die Konfiguration Ihrer PHP-Umgebung zu überprüfen:

PHP crawlt HTTPS-Websiteinhalte

Die Ausgabe lautet wie folgt:

640 (1).jpg

Wenn Sie einen Remote-Host verwenden und die Konfiguration nicht ändern können,

Eine weitere häufig verwendete Funktion zum Erfassen von Inhalten in PHP ist curl. Sie ist leistungsfähiger als file_get_contents() und bietet viele Möglichkeiten optionale Parameter. Für das Problem des Zugriffs auf HTTPS-Inhalte müssen wir folgende CURL-Konfigurationsparameter verwenden:

640 (2).jpg

Es kann semantisch verstanden werden, es ist ignorieren/überspringen SSL-Sicherheitsüberprüfung.

Das Folgende ist eine von Curl gekapselte Funktion, die auf HTTPS-Inhalte zugreifen kann:


640 (3).jpg

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn