Maison >développement back-end >tutoriel php >Comment résoudre le problème php substr tronqué

Comment résoudre le problème php substr tronqué

小云云
小云云original
2017-11-11 11:20:393704parcourir

php substr est une fonction fonctionnelle développée sur la base du langage php qui peut renvoyer une partie d'une chaîne. Parfois, lorsque nous utilisons php substr, des caractères tronqués apparaissent. Comment le résoudre ?

string substr ( string $string , int $start [, int $length ] )

Renvoie une chaîne de longueur commençant à la position de départ dans la chaîne

La fonction substr intercepte les caractères par octets. Les caractères chinois sont de 2 lorsqu'ils sont codés en GB2312 octets, l'encodage UTF-8 est. 3 octets, donc si les caractères chinois sont tronqués lors de l'interception d'une chaîne de longueur spécifiée, le résultat renvoyé sera tronqué lors de l'affichage.

Après vérification, les solutions peuvent être résumées en deux catégories :

1. Utilisez plutôt la fonction mb_substr()

string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] )

Similaire à la fonction substr(. ), en comptant simplement par le nombre de caractères pour garantir la sécurité des caractères

L'utilisation de la fonction mb_substr() peut garantir qu'il n'y aura pas de caractères tronqués, mais l'inconvénient est que les statistiques de longueur deviennent à la place le nombre de caractères du nombre d'octets. Lorsqu'il est utilisé pour l'affichage, il y aura une grande différence dans la longueur d'affichage entre les résultats chinois et les résultats anglais de même longueur.

2. Fonction auto-construite pour améliorer la fonction substr

Voici une fonction qui peut mieux résoudre le problème de la rencontre des caractères chinois par substr. Les caractères chinois sont calculés en 2 unités de longueur, de sorte que la longueur d'affichage finale des résultats d'interception de chaîne dans un environnement mixte chinois et anglais soit proche ; le dernier caractère incomplet est ignoré pour garantir qu'il n'y aura pas de caractères tronqués sur l'écran ; il est compatible avec l'UTF couramment utilisé pour l'encodage des caractères chinois -8 et l'encodage GB2312 a une bonne polyvalence.

Afficher le code source

  function getstr($string, $length, $encoding  = 'utf-8') {    
 $string = trim($string);    
 if($length && strlen($string) > $length) {    
  //截断字符    
  $wordscut = '';    
  if(strtolower($encoding) == 'utf-8') {    
  //utf8编码    
   $n = 0;    
  $tn = 0;    
 $noc = 0;    
 while ($n < strlen($string)) {    
  $t = ord($string[$n]);    
 if($t == 9 || $t == 10 || (32 <= $t && $t <= 126)) {    
 $tn = 1;    
 $n++;    
  $noc++;    
 } elseif(194 <= $t && $t <= 223) {    
 $tn = 2;    
 $n += 2;    
} elseif(224 <= $t && $t < 239) {    
  $tn = 3;    
  $n += 3;    
  $noc += 2;    
 } elseif(240 <= $t && $t <= 247) {    
 $tn = 4;    
 $n += 4;    
 $noc += 2;    
 } elseif(248 <= $t && $t <= 251) {    
  $tn = 5;    
$n += 5;    
   $noc += 2;    
 } elseif($t == 252 || $t == 253) {    
 $tn = 6;    
   $n += 6;    
   $noc += 2;    
  } else {    
 $n++;    
}    
 if ($noc >= $length) {    
break;    
 }    
}    
 if ($noc > $length) {    
$n -= $tn;    
  }    
 $wordscut = substr($string, 0, $n);    
 } else {    
 for($i = 0; $i < $length - 1; $i++) {    
  if(ord($string[$i]) > 127) {    
$wordscut .= $string[$i].$string[$i + 1];    
$i++;    
 } else {    
   $wordscut .= $string[$i];    
  }    
 }    
  }    
$string = $wordscut;    
 }    
return trim($string);    
 }    
 // 示例    
 echo getstr("0一二三四五六七",1).&#39;<br />&#39;;  // 0    
 echo getstr("0一二三四五六七",2).&#39;<br />&#39;;  // 0    
echo getstr("0一二三四五六七",3).&#39;<br />&#39;;  // 0一    
 echo getstr("0一二三四五六七",4).&#39;<br />&#39;;  // 0一    
 echo getstr("0一二三四五六七",5).&#39;<br />&#39;;  // 0一二    
 echo getstr("0一a二b三四五六七",1).&#39;<br />&#39;;    // 0    
  echo getstr("0一a二b三四五六七",2).&#39;<br />&#39;;    // 0    
 echo getstr("0一a二b三四五六七",3).&#39;<br />&#39;;    // 0一    
 echo getstr("0一a二b三四五六七",4).&#39;<br />&#39;;    // 0一a    
  echo getstr("0一a二b三四五六七",5).&#39;<br />&#39;;    // 0一a

Cette fonction est modifiée à partir de la fonction getstr() dans UCHome 1.5.

Ce qui précède est la solution pour résoudre le problème des caractères tronqués de php substr. Nous avons également partagé une série d'articles sur la fonction php substr auparavant. Si vous en avez besoin, vous pouvez faire attention à PHP. Site chinois.

Recommandations associées :

Quelques programmes sur la fonction PHP substr()

Explication chinoise détaillée du traitement de la fonction php substr()

Explication sur l'utilisation de l'interception de chaîne de fonction php substr()


Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn