Maison >développement back-end >Problème PHP >Que faire si une chaîne php intercepte des caractères tronqués
Solution pour intercepter les caractères tronqués dans les chaînes PHP : 1. Utilisez [mb_substr()] de la bibliothèque d'extension mbstring pour intercepter ; 2. Interceptez les chaînes encodées [UTF-8], le code est [$str = trim ( $str);].
Solution pour l'interception de chaînes php de caractères tronqués :
1. Utilisez mb_substr de la bibliothèque d'extension mbstring. () l'interception ne provoquera pas de caractères tronqués.
Vous pouvez utiliser la fonction mb_substr()/mb_strcut(). L'utilisation de mb_substr()/mb_strcut() est similaire à substr(), sauf qu'un paramètre supplémentaire est ajouté à la fin de. mb_substr()/mb_strcut. Pour définir l'encodage de la chaîne,
mais la plupart des serveurs n'ouvrent pas php_mbstring.dll Vous devez ouvrir php_mbstring.dll dans php.ini.
echo mb_substr("php中文字符encode",0,4,"utf-8");
Si le dernier paramètre d'encodage n'est pas spécifié, trois octets seront utilisés comme un caractère chinois. C'est la caractéristique de l'encodage utf-8. Si la description du jeu de caractères utf-8 est ajoutée, elle le sera. un caractère intercepté pour l’unité.
Lors de son utilisation, faites attention à l'encodage du fichier php et à l'encodage lors de l'affichage de la page Web. Pour utiliser cette méthode mb_substr, vous devez connaître l'encodage de la chaîne à l'avance. Si vous ne connaissez pas l'encodage, vous devez juger. La bibliothèque mbstring fournit également mb_check_encoding pour vérifier l'encodage de la chaîne, mais ce n'est pas encore parfait. .
PHP est livré avec plusieurs fonctions d'interception de chaînes, parmi lesquelles substr et mb_substr sont couramment utilisées. Lorsque le premier traite le chinois, GBK correspond à 2 unités de longueur et UTF à 3 unités de longueur. Après que le second ait spécifié le codage, un caractère chinois correspond à 1 unité de longueur.
substr coupe parfois 1/3 du chinois ou la moitié du chinois et affiche des caractères tronqués. Relativement parlant, mb_substr nous convient mieux. Mais parfois, mb_substr ne semble pas si utile. Par exemple, si je souhaite afficher les brèves informations d'une petite image, 5 caractères chinois suffisent. S'il y a plus de 5 caractères, interceptez simplement les 4 premiers et ajoutez "...". Cela ne pose aucun problème lors du traitement. Chinois, mais lors du traitement de l'anglais ou des chiffres, cette interception sera trop courte.
2. Écrivez vous-même la fonction d'interception, mais l'efficacité n'est pas aussi élevée que l'utilisation de la bibliothèque d'extension mbstring. Ce qui suit est une fonction d'ecshop qui intercepte les chaînes codées en UTF-8.
function sub_str($str, $length = , $append = true) { $str = trim($str); $strlength = strlen($str); if ($length == || $length >= $strlength) { return $str; //截取长度等于或大于等于本字符串的长度,返回字符串本身 } elseif ($length < ) //如果截取长度为负数 { $length = $strlength + $length;//那么截取长度就等于字符串长度减去截取长度 if ($length < ) { $length = $strlength;//如果截取长度的绝对值大于字符串本身长度,则截取长度取字符串本身的长度 } } if (function_exists('mb_substr')) { $newstr = mb_substr($str, , $length, EC_CHARSET); } elseif (function_exists('iconv_substr')) { $newstr = iconv_substr($str, , $length, EC_CHARSET); } else { //$newstr = trim_right(substr($str, , $length)); $newstr = substr($str, , $length); } if ($append && $str != $newstr) { $newstr .= '...'; } return $newstr; }
Si vous souhaitez en savoir plus sur la programmation, faites attention à la rubrique formation php !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!