Heim > Artikel > Backend-Entwicklung > So lösen Sie das verstümmelte Problem des PHP-Webcrawlens
Lösung für das Crawlen verstümmelter PHP-Webseiten: 1. Verwenden Sie „mbconvertencoding“, um die Codierung zu konvertieren. 2. Legen Sie die Option „curl_setopt($ch, CURLOPT_ENCODING, ‚gzip‘)“ fest.
Empfohlen: „PHP-Video-Tutorial“
php crawlt die Seite mit verstümmelten Zeichen
Beim Crawlen der Seite erscheinen verstümmelte Zeichen wie ������. Die Lösung ist wie folgt
1. Konvertieren Sie die Kodierung
str=mbconvertencoding(str, “utf-8”, “GBK”);
2. Die Daten werden von gzip komprimiert
Wenn Curl die Daten erhält, legen Sie die folgenden Optionen fest und fügen Sie sie hinzu:
curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
Die Verwendung der Funktion „file_get_contents“ erfordert die Installation der zlib-Bibliothek
$data = file_get_contents("compress.zlib://".$url);
3. Nach Erhalt der Daten werden verstümmelte Zeichen angezeigt
Fügen Sie oben den folgenden Code für
header("Content-type: text/html; charset=utf-8");hinzu
Das obige ist der detaillierte Inhalt vonSo lösen Sie das verstümmelte Problem des PHP-Webcrawlens. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!