首頁  >  文章  >  後端開發  >  PHP如何將不是UTF8的字元過濾掉(程式碼)

PHP如何將不是UTF8的字元過濾掉(程式碼)

不言
不言原創
2018-08-14 17:20:212729瀏覽

這篇文章帶給大家的內容是關於PHP如何將不是UTF8的字元過濾掉(程式碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。

function utf8_filter($data)
  {
     $str = "";
     for($n = 0; $n < strlen($data);)
     {
          $s = substr($data, $n, 1);
          $v = ord($s);
          if($v >= 127)
          {
             ++$n;
             $cnt = 0;
             $tmp = $v;
             while($tmp & 0x80)
             {
                $tmp = $tmp << 1;
                ++$cnt;
              }
              $x = 0;
              while($x < $cnt && $n < strlen($data))
              {
                $s = substr($data, $n, 1);
                if((ord($s) & 0xC0) == 0x80)
                {
                   ++$n;
                   ++$x;
                 }else{
                         break;
                        }
                  }
                 if($x + 1 == $cnt)
                 {
                    $str  = $str . substr($data, $n - $cnt, $cnt);
                  }else{
                         while($n < strlen($data))
                        {
                          $s = substr($data, $n, 1);
                          if(ord($s) & 0x80)
                          {
                             ++$n;
                           }else{
                                    break;
                                 }
                            }
          }
         }else{
       $str = $str. $s;
       ++$n;
      }
}
return  $str;
}

相關推薦:

過濾utf8 字符中超過三個字節的字符,或非utf8字符

# PHP實作過濾掉非漢字字符只保留中文字符,

#

以上是PHP如何將不是UTF8的字元過濾掉(程式碼)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn