首頁  >  文章  >  後端開發  >  PHP中文字串截斷無亂碼解決方法

PHP中文字串截斷無亂碼解決方法

高洛峰
高洛峰原創
2016-12-20 15:46:121290瀏覽

一個比較好用的字串截取函數:

function substring($str, $start, $length){ //比较好用字符串截取函数
  $len = $length;
  if($length < 0){
  $str = strrev($str);
  $len = -$length;
  }
  $len= ($len < strlen($str)) ? $len : strlen($str);
  $tmpstr = "";
  for ($i= $start; $i < $len; $i ++)
  {
      if (ord(substr($str, $i, 1)) > 0xa0)
      {
       $tmpstr .= substr($str, $i, 2);
       $i++;
      } else {
       $tmpstr .= substr($str, $i, 1);
      }
  }
  if($length < 0) $tmpstr = strrev($tmpstr);
  return $tmpstr;
}

   

使用方法範例:

$str1 = &#39;我是一串比较长的中文不带英文&#39;;
$str2 = &#39;我是一串比较长的中文带yingwen&#39;;
 
 
$len = strlen($str1);
echo &#39;<br />&#39;.$len; //return 28
 
$len = strlen($str2);
echo &#39;<br />&#39;.$len; //return 29
 
echo &#39;<br />&#39;; 
echo substring($str1, 0, 11); 
echo &#39;<br />&#39;;
echo substring($str2, 0, 11);   
echo &#39;<br />&#39;;
echo substring($str1, 16, 28); 
echo &#39;<br />&#39;;
echo substring($str2, 16, 29);

   

中文不帶英文

中文帶yingwen


這個函數十分有用,例如用來截斷比較長的文件名,但是要在中間加上...,可以這樣來做:

function formatName($str, $size){
  $len = strlen($str);
  if(strlen($str) > $size) {
    $part1 = substring($str, 0, $size / 2);
    $part2 = substring($str, $len - ($size/2), $len);
    return $part1 . "..." . $part2;
  } else {
    return $str;
  }
}

   

,另外網路上看到超簡單的中文截斷解決方案,試用了一下,效果也不錯:

echo substr($str1,0,10).chr(0);

原理解釋:

chr(0 )不是null
07null是什麼都沒有,而chr(0)的值是0。表示成16進位是0x00,表示成二進位是00000000

08雖然chr(0)不會顯示出什麼,但是他是一個字元。

09當漢字被截斷時,根據編碼規則他總是要把後邊的其他字符拉過來一起作為漢字解釋,這就是出現亂碼的原因。而值為0x81到0xff與0x00組合始終都顯示為「空」

10根據這一特點,在substr的結果後面補上一個chr(0),就可以防止出現亂碼了


------ ----------------------


20120705更新: 


以上方法雖好,但是偶爾還是會碰到亂碼,原因未深究。不過可以用以下的方法,對UTF8字元文字屢試不爽。

注意:此方法中將漢字計算為1單位長度,英文一個字母1單位長度,所以截斷時需要注意長度設定。

計算長度的方法:

function strlen_UTF8($str)
{
  $len = strlen($str);
  $n = 0;
  for($i = 0; $i < $len; $i++) {
    $x = substr($str, $i, 1);
    $a = base_convert(ord($x), 10, 2);
    $a = substr(&#39;00000000&#39;.$a, -8);
    if (substr($a, 0, 1) == 0) {
    }elseif (substr($a, 0, 3) == 110) {
      $i += 1;
    }elseif (substr($a, 0, 4) == 1110) {
      $i += 2;
    }
    $n++;
  }
  return $n;
} // End strlen_UTF8;

   



字串截斷函數:

function subString_UTF8($str, $start, $lenth)
  {
    $len = strlen($str);
    $r = array();
    $n = 0;
    $m = 0;
    for($i = 0; $i < $len; $i++) {
      $x = substr($str, $i, 1);
      $a = base_convert(ord($x), 10, 2);
      $a = substr(&#39;00000000&#39;.$a, -8);
      if ($n < $start){
        if (substr($a, 0, 1) == 0) {
        }elseif (substr($a, 0, 3) == 110) {
          $i += 1;
        }elseif (substr($a, 0, 4) == 1110) {
          $i += 2;
        }
        $n++;
      }else{
        if (substr($a, 0, 1) == 0) {
          $r[ ] = substr($str, $i, 1);
        }elseif (substr($a, 0, 3) == 110) {
          $r[ ] = substr($str, $i, 2);
          $i += 1;
        }elseif (substr($a, 0, 4) == 1110) {
          $r[ ] = substr($str, $i, 3);
          $i += 2;
        }else{
          $r[ ] = &#39;&#39;;
        }
        if (++$m >= $lenth){
          break;
        }
      }
    }
    return join($r);
  } // End subString_UTF8;

   

Name

使用方法和之前介紹的長度
function formatName($str, $size){
 $len = strlen_UTF8($str);
 $one_len = strlen($str);
 $size = $size * 1.5 * $len / ($one_len);
 if(strlen_UTF8($str) > $size) {
  $part1 = subString_UTF8($str, 0, $size / 2);
  $part2 = subString_UTF8($str, $len - ($size/2), $len);
  return $part1 . "..." . $part2;
 } else {
  return $str;
 }
}

   

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持PHP中文網。

更多PHP中文字串截斷無亂碼解決方法相關文章請關注PHP中文網!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn