首页 >后端开发 >php教程 >PHP如何将不是UTF8的字符过滤掉(代码)

PHP如何将不是UTF8的字符过滤掉(代码)

不言
不言原创
2018-08-14 17:20:212757浏览

本篇文章给大家带来的内容是关于PHP如何将不是UTF8的字符过滤掉(代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。

function utf8_filter($data)
  {
     $str = "";
     for($n = 0; $n < strlen($data);)
     {
          $s = substr($data, $n, 1);
          $v = ord($s);
          if($v >= 127)
          {
             ++$n;
             $cnt = 0;
             $tmp = $v;
             while($tmp & 0x80)
             {
                $tmp = $tmp << 1;
                ++$cnt;
              }
              $x = 0;
              while($x < $cnt && $n < strlen($data))
              {
                $s = substr($data, $n, 1);
                if((ord($s) & 0xC0) == 0x80)
                {
                   ++$n;
                   ++$x;
                 }else{
                         break;
                        }
                  }
                 if($x + 1 == $cnt)
                 {
                    $str  = $str . substr($data, $n - $cnt, $cnt);
                  }else{
                         while($n < strlen($data))
                        {
                          $s = substr($data, $n, 1);
                          if(ord($s) & 0x80)
                          {
                             ++$n;
                           }else{
                                    break;
                                 }
                            }
          }
         }else{
       $str = $str. $s;
       ++$n;
      }
}
return  $str;
}

相关推荐:

过滤utf8 字符中超过三个字节的字符,或者非utf8字符

PHP实现过滤掉非汉字字符只保留中文字符,

以上是PHP如何将不是UTF8的字符过滤掉(代码)的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn