>  기사  >  백엔드 개발  >  PHP에서 UTF8이 아닌 문자를 필터링하는 방법(코드)

PHP에서 UTF8이 아닌 문자를 필터링하는 방법(코드)

不言
不言원래의
2018-08-14 17:20:212729검색

이 문서의 내용은 PHP가 UTF8(코드)이 아닌 문자를 필터링하는 방법에 대한 것입니다. 이는 특정 참조 값이 있으므로 도움이 필요한 친구에게 도움이 되길 바랍니다.

function utf8_filter($data)
  {
     $str = "";
     for($n = 0; $n < strlen($data);)
     {
          $s = substr($data, $n, 1);
          $v = ord($s);
          if($v >= 127)
          {
             ++$n;
             $cnt = 0;
             $tmp = $v;
             while($tmp & 0x80)
             {
                $tmp = $tmp << 1;
                ++$cnt;
              }
              $x = 0;
              while($x < $cnt && $n < strlen($data))
              {
                $s = substr($data, $n, 1);
                if((ord($s) & 0xC0) == 0x80)
                {
                   ++$n;
                   ++$x;
                 }else{
                         break;
                        }
                  }
                 if($x + 1 == $cnt)
                 {
                    $str  = $str . substr($data, $n - $cnt, $cnt);
                  }else{
                         while($n < strlen($data))
                        {
                          $s = substr($data, $n, 1);
                          if(ord($s) & 0x80)
                          {
                             ++$n;
                           }else{
                                    break;
                                 }
                            }
          }
         }else{
       $str = $str. $s;
       ++$n;
      }
}
return  $str;
}

관련 권장 사항:

utf8 문자 또는 비utf8 문자에서 3바이트를 초과하는 문자 필터링

PHP는 중국어가 아닌 문자를 필터링하고 중국어 문자만 유지하도록 구현합니다.

위 내용은 PHP에서 UTF8이 아닌 문자를 필터링하는 방법(코드)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.