Heim  >  Artikel  >  Backend-Entwicklung  >  Die Funktion zum Erkennen, ob eine Zeichenfolge in PHP utf8-codiert ist

Die Funktion zum Erkennen, ob eine Zeichenfolge in PHP utf8-codiert ist

怪我咯
怪我咯Original
2017-07-09 09:26:151872Durchsuche

Wie kann man bei einer gegebenen Zeichenfolge feststellen, um welche Codierung es sich handelt? PHP hat eine -Funktion : mb_detect_encoding. Allerdings erfordert dieses Ding die Bibliothek mb_string, die nicht überall verfügbar ist.

 function is_utf8($string) { 
     return preg_match('%^(?: 
             [\x09\x0A\x0D\x20-\x7E]                 # ASCII 
         | [\xC2-\xDF][\x80-\xBF]                 # non-overlong 2-byte 
         |     \xE0[\xA0-\xBF][\x80-\xBF]             # excluding overlongs 
         | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}     # straight 3-byte 
         |     \xED[\x80-\x9F][\x80-\xBF]             # excluding surrogates 
         |     \xF0[\x90-\xBF][\x80-\xBF]{2}     # planes 1-3 
         | [\xF1-\xF3][\x80-\xBF]{3}             # planes 4-15 
         |     \xF4[\x80-\x8F][\x80-\xBF]{2}     # plane 16 
     )*$%xs', $string);      
}

Die Genauigkeit ist im Grunde die gleiche wie bei mb_detect_encoding, sowohl richtig als auch falsch.
Die Kodierungserkennung kann nicht 100 % genau sein, dieses Ding kann grundsätzlich die Anforderungen erfüllen.

Das obige ist der detaillierte Inhalt vonDie Funktion zum Erkennen, ob eine Zeichenfolge in PHP utf8-codiert ist. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn