Heim  >  Artikel  >  Backend-Entwicklung  >  Lösung für das Problem verstümmelter chinesischer Zeichen, wenn PHP Zeichenfolgen abfängt

Lösung für das Problem verstümmelter chinesischer Zeichen, wenn PHP Zeichenfolgen abfängt

黄舟
黄舟Original
2017-11-15 09:46:132869Durchsuche

Im vorherigen Artikel haben wir Ihnen die Implementierung des Abfangens von Zeichenfolgen in PHP und die Verwendung von PHP zum Abfangen chinesischer Zeichenfolgen erläutert. Wenn wir dann chinesische Zeichenfolgen abfangen, treten viele Probleme auf von verstümmelten Zeichen, dann stellen wir Ihnen heute vor, wie Sie das Problem chinesischer verstümmelter Zeichen beim Abfangen von Zeichenfolgen in PHP lösen können!

PHP verwendet substr, um Zeichenfolgen abzufangen, und das chinesische verstümmelte Problem tritt auf.
Beispiel:

mb_substr('截取中文乱码问题测试',0,5, 'utf-8');

Syntax:

string substr (string string, int start [, int length])
$rest = substr ("abcdef", 1); // returns "bcdef"
$rest = substr ("abcdef", 1, 3); // returns "bcd"

Wenn start ein ist Negative Zahl, gib sie zurück. Die Zeichenfolge beginnt mit dem Startzeichen am Ende der Zeichenfolge.

$rest = substr ("abcdef", -1); // returns "f"
$rest = substr ("abcdef", -2); // returns "ef"
$rest = substr ("abcdef", -3, 1); // returns "d"

Wenn die Parameterlänge angegeben ist und eine positive Zahl ist, besteht die zurückgegebene Zeichenfolge vom Anfang an aus Längenzeichen.

Wenn die Parameterlänge angegeben wird und eine negative Zahl ist, endet die zurückgegebene Zeichenfolge beim längenstärksten Zeichen vom Ende der Zeichenfolge.

$rest = substr ("abcdef", 1, -1); // returns "bcde"

Es gibt kein Problem mit Englisch.

$rest = substr ("中国人", 1, -1); // returns "fdsafsda" 就是乱码了

Das Ergebnis des Abfangens von Zeichen ist definitiv nicht das, was wir wollen Wenn die chinesischen Zeichen von PHP substr verstümmelt sind, wird das Programm möglicherweise nicht ordnungsgemäß ausgeführt.
Es gibt zwei Hauptlösungen:

Verwenden Sie zunächst mb_substr() der mbstring-Erweiterungsbibliothek zum Abfangen, damit keine verstümmelten Zeichen angezeigt werden.
Sie können die Funktion mb_substr()/mb_strcut() verwenden. Die Verwendung von mb_substr()/mb_strcut() ähnelt substr(), außer dass am Ende von mb_substr ein weiterer Parameter hinzugefügt werden muss ()/mb_strcut, um die String-Kodierung festzulegen,
, aber die meisten Server öffnen php_mbstring.dll nicht. Sie müssen php_mbstring.dll in php.ini öffnen.

echo mb_substr("php中文字符encode",0,4,"utf-8");

Wenn der letzte Kodierungsparameter nicht angegeben ist, sind drei Bytes ein chinesisches Zeichen. Dies ist das Merkmal der UTF-8-Kodierung, wenn der Zeichensatz utf-8 ist hinzugefügt Erklärung wird daher in Einheiten eines Wortes abgefangen. Achten Sie bei der Verwendung auf die Kodierung der PHP-Datei und die Kodierung beim Anzeigen der Webseite. Um diese mb_substr-Methode zu verwenden, müssen Sie die Codierung der Zeichenfolge im Voraus kennen. Wenn Sie die Codierung nicht kennen, müssen Sie sie beurteilen. Die mbstring-Bibliothek bietet auch mb_check_encoding, um die Zeichenfolgencodierung zu überprüfen .

PHP verfügt über mehrere

String-Interception-Funktionen, darunter substr und mb_substr, die häufig verwendet werden. Wenn ersteres Chinesisch verarbeitet, beträgt GBK 2 Längeneinheiten und UTF 3 Längeneinheiten. Nachdem letzteres die Codierung angegeben hat, ist ein chinesisches Zeichen 1 Längeneinheit.

substr schneidet manchmal 1/3 Chinesisch oder die Hälfte Chinesisch ab und zeigt verstümmelte Zeichen an. Relativ gesehen ist mb_substr für uns besser geeignet. Aber manchmal scheint mb_substr nicht so nützlich zu sein. Wenn ich beispielsweise die kurzen Informationen eines kleinen

Bildes anzeigen möchte, sind 5 chinesische Zeichen genau richtig. Wenn es mehr als 5 Zeichen sind, fangen Sie einfach die ersten 4 ab und fügen Sie „…“ hinzu. Auf diese Weise gibt es kein Problem bei der Verarbeitung chinesischer Zeichen, aber bei der Verarbeitung von Englisch oder Zahlen wäre dieser Abfang zu kurz.

2. Schreiben Sie die Abfangfunktion selbst, aber die Effizienz ist nicht so hoch wie die Verwendung der mbstring-Erweiterungsbibliothek. Das Folgende ist eine Funktion in ecshop, die in UTF-8 codierte Zeichenfolgen abfängt.

function sub_str($str, $length = , $append = true)
{
  $str = trim($str);
  $strlength = strlen($str);
  if ($length == || $length >= $strlength)
  {
    return $str; //截取长度等于或大于等于本字符串的长度,返回字符串本身
  }
  elseif ($length < ) //如果截取长度为负数
  {
    $length = $strlength + $length;//那么截取长度就等于字符串长度减去截取长度
    if ($length < )
    {
      $length = $strlength;//如果截取长度的绝对值大于字符串本身长度,则截取长度取字符串本身的长度
    }
  }
  if (function_exists(&#39;mb_substr&#39;))
  {
    $newstr = mb_substr($str, , $length, EC_CHARSET);
  }
  elseif (function_exists(&#39;iconv_substr&#39;))
  {
    $newstr = iconv_substr($str, , $length, EC_CHARSET);
  }
  else
  {
    //$newstr = trim_right(substr($str, , $length));
    $newstr = substr($str, , $length);
  }
  if ($append && $str != $newstr)
  {
    $newstr .= &#39;...&#39;;
  }
  return $newstr;
}

Zusammenfassung:

In diesem Artikel werden zwei Beispiele verwendet, um die Lösung für verstümmelte chinesische Zeichen beim Abfangen von Zeichenfolgen in PHP vorzustellen . Ich glaube, wenn Freunde das gleiche Problem haben, können sie es leicht lösen!

Verwandte Empfehlungen:

Instanzen, in denen PHP chinesische Zeichenfolgen abfängt und die Anzahl der Zeichen in chinesischen Zeichenfolgen ermittelt


Einführung in das Abfangen von Strings mit PHP

PHP-Abfangen Detaillierte Erläuterung der Verwendung der Zeichenfolgenfunktion substr() Funktionsbeispiel

Das obige ist der detaillierte Inhalt vonLösung für das Problem verstümmelter chinesischer Zeichen, wenn PHP Zeichenfolgen abfängt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn