Heim >Backend-Entwicklung >PHP-Problem >So lösen Sie das chinesische verstümmelte Problem von PHP mbsubstr
Lösung für den verstümmelten Code von PHP mbsubstr: 1. Verwenden Sie mb_substr() der mbstring-Erweiterungsbibliothek zum Abfangen. 2. Lösen Sie das Problem des verstümmelten Codes mit der benutzerdefinierten Methode „function sub_str(){...}“.
Die Betriebsumgebung dieses Artikels: Windows 7-System, PHP 7.1-Version, Dell G3-Computer
Wie löse ich das chinesische verstümmelte Problem von PHP mbsubstr?
PHP verwendet substr, um Zeichenfolgen und Chinesisch abzufangen Es tritt ein verstümmeltes Problem auf. Verwenden Sie mb_substr
Beispiel: mb_substr('Interception of Chinese Garbled Code Problem Test',0,5, 'utf-8');
语法 : string substr (string string, int start [, int length]) $rest = substr ("abcdef", 1); // returns "bcdef" $rest = substr ("abcdef", 1, 3); // returns "bcd"
Wenn start eine negative Zahl ist, beginnt die zurückgegebene Zeichenfolge mit dem Startzeichen am Ende der Zeichenfolge.
$rest = substr ("abcdef", -1); // returns "f" $rest = substr ("abcdef", -2); // returns "ef" $rest = substr ("abcdef", -3, 1); // returns "d"
Wenn die Parameterlänge angegeben ist und eine positive Zahl ist, besteht die zurückgegebene Zeichenfolge vom Anfang an aus Längenzeichen.
Wenn die Parameterlänge angegeben ist und es sich um eine negative Zahl handelt, endet die zurückgegebene Zeichenfolge beim längenstärksten Zeichen vom Ende der Zeichenfolge.
$rest = substr ("abcdef", 1, -1); // returns "bcde"
Es gibt kein Problem mit Englisch.
$rest = substr ("中国人", 1, -1); // returns "fdsafsda" 就是乱码了
Das Ergebnis des Abfangens von Zeichen ist definitiv nicht das Ergebnis, das wir wollen. Diese Situation mit verstümmelten chinesischen PHP-Substrängen kann dazu führen, dass das Programm nicht normal ausgeführt wird.
Es gibt zwei Hauptlösungen:
1. Verwenden Sie mb_substr() der mbstring-Erweiterungsbibliothek zum Abfangen, damit keine verstümmelten Zeichen angezeigt werden.
Sie können die Funktion mb_substr()/mb_strcut() verwenden. Die Verwendung von mb_substr()/mb_strcut() ähnelt substr(), außer dass am Ende von mb_substr()/mb_strcut() ein weiterer Parameter hinzugefügt wird die Kodierung der Zeichenfolge. ,
Aber die meisten Server öffnen php_mbstring.dll nicht. Sie müssen php_mbstring.dll in php.ini öffnen.
echo mb_substr("php中文字符encode",0,4,"utf-8");
Wenn der letzte Kodierungsparameter nicht angegeben ist, werden drei Bytes als ein chinesisches Zeichen verwendet. Dies ist das Merkmal der UTF-8-Kodierung. Wenn die UTF-8-Zeichensatzbeschreibung hinzugefügt wird, wird sie in Einheiten von abgefangen ein Wort von.
Achten Sie bei der Verwendung auf die Kodierung der PHP-Datei und die Kodierung beim Anzeigen der Webseite. Um diese mb_substr-Methode zu verwenden, müssen Sie die Codierung der Zeichenfolge im Voraus kennen. Wenn Sie die Codierung nicht kennen, müssen Sie sie beurteilen. Die mbstring-Bibliothek bietet auch mb_check_encoding, um die Zeichenfolgencodierung zu überprüfen .
PHP verfügt über mehrere Funktionen zum Abfangen von Zeichenfolgen, unter denen häufig substr und mb_substr verwendet werden. Wenn ersteres Chinesisch verarbeitet, beträgt GBK 2 Längeneinheiten und UTF 3 Längeneinheiten. Nachdem letzteres die Codierung angegeben hat, ist ein chinesisches Zeichen 1 Längeneinheit.
substr schneidet manchmal 1/3 Chinesisch oder die Hälfte Chinesisch ab und zeigt verstümmelte Zeichen an. Relativ gesehen ist mb_substr für uns besser geeignet. Aber manchmal scheint mb_substr nicht so nützlich zu sein. Wenn ich beispielsweise die kurzen Informationen eines kleinen Bildes anzeigen möchte, sind 5 chinesische Zeichen genau richtig. Wenn es mehr als 5 Zeichen sind, fangen Sie einfach die ersten 4 ab und fügen Sie „…“ hinzu Chinesisch, aber bei der Verarbeitung von Englisch oder Zahlen ist dieser Abfang zu kurz.
Empfohlen: „PHP-Video-Tutorial“
Zweitens schreiben Sie die Abfangfunktion selbst, aber die Effizienz ist nicht so hoch wie die Verwendung der MBstring-Erweiterungsbibliothek. Das Folgende ist eine Funktion in ecshop, die in UTF-8 codierte Zeichenfolgen abfängt.
function sub_str($str, $length = , $append = true) { $str = trim($str); $strlength = strlen($str); if ($length == || $length >= $strlength) { return $str; //截取长度等于或大于等于本字符串的长度,返回字符串本身 } elseif ($length < ) //如果截取长度为负数 { $length = $strlength + $length;//那么截取长度就等于字符串长度减去截取长度 if ($length < ) { $length = $strlength;//如果截取长度的绝对值大于字符串本身长度,则截取长度取字符串本身的长度 } } if (function_exists('mb_substr')) { $newstr = mb_substr($str, , $length, EC_CHARSET); } elseif (function_exists('iconv_substr')) { $newstr = iconv_substr($str, , $length, EC_CHARSET); } else { //$newstr = trim_right(substr($str, , $length)); $newstr = substr($str, , $length); } if ($append && $str != $newstr) { $newstr .= '...'; } return $newstr; }
Das obige ist der detaillierte Inhalt vonSo lösen Sie das chinesische verstümmelte Problem von PHP mbsubstr. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!