Maison  >  Article  >  développement back-end  >  La fonction de détecter si une chaîne est codée en utf8 en php

La fonction de détecter si une chaîne est codée en utf8 en php

怪我咯
怪我咯original
2017-07-09 09:26:151923parcourir

Étant donné une chaîne, comment déterminer de quel encodage il s'agit ? PHP a une fonction : mb_detect_encoding. Cependant, cette chose nécessite la bibliothèque mb_string, qui n'est pas disponible partout.

 function is_utf8($string) { 
     return preg_match('%^(?: 
             [\x09\x0A\x0D\x20-\x7E]                 # ASCII 
         | [\xC2-\xDF][\x80-\xBF]                 # non-overlong 2-byte 
         |     \xE0[\xA0-\xBF][\x80-\xBF]             # excluding overlongs 
         | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}     # straight 3-byte 
         |     \xED[\x80-\x9F][\x80-\xBF]             # excluding surrogates 
         |     \xF0[\x90-\xBF][\x80-\xBF]{2}     # planes 1-3 
         | [\xF1-\xF3][\x80-\xBF]{3}             # planes 4-15 
         |     \xF4[\x80-\x8F][\x80-\xBF]{2}     # plane 16 
     )*$%xs', $string);      
}

La précision est fondamentalement la même que celle de mb_detect_encoding, à la fois correcte et fausse.
La détection de l'encodage ne peut pas être précise à 100 %, cette chose peut essentiellement répondre aux exigences.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn