Heim >Schlagzeilen >PHP crawlt HTTPS-Websiteinhalte
Im Gegensatz zum normalen HTTP-Protokoll tritt bei Verwendung der Funktion file_get_contents() in PHP zum Abrufen der in der API bereitgestellten Daten ein Fehler auf.
Das liegt daran, dass in der PHP-Konfigurationsdatei kein Parameter aktiviert ist. Er befindet sich in /apache/bin/php.ini; Sie müssen die vorherige Version ändern das Semikolon. Sie können das folgende Skript verwenden, um die Konfiguration Ihrer PHP-Umgebung zu überprüfen:
Die Ausgabe lautet wie folgt:
Wenn Sie einen Remote-Host verwenden und die Konfiguration nicht ändern können,
Eine weitere häufig verwendete Funktion zum Erfassen von Inhalten in PHP ist curl. Sie ist leistungsfähiger als file_get_contents() und bietet viele Möglichkeiten optionale Parameter. Für das Problem des Zugriffs auf HTTPS-Inhalte müssen wir folgende CURL-Konfigurationsparameter verwenden:
Es kann semantisch verstanden werden, es ist ignorieren/überspringen SSL-Sicherheitsüberprüfung.
Das Folgende ist eine von Curl gekapselte Funktion, die auf HTTPS-Inhalte zugreifen kann: