ホームページ  >  記事  >  バックエンド開発  >  PHP で UTF8 ではない文字を除外する方法 (コード)

PHP で UTF8 ではない文字を除外する方法 (コード)

不言
不言オリジナル
2018-08-14 17:20:212743ブラウズ

この記事の内容は、PHP が UTF8 (コード) 以外の文字をどのようにフィルタリングするかに関するもので、一定の参考値があり、必要な友人が参照することができます。

function utf8_filter($data)
  {
     $str = "";
     for($n = 0; $n < strlen($data);)
     {
          $s = substr($data, $n, 1);
          $v = ord($s);
          if($v >= 127)
          {
             ++$n;
             $cnt = 0;
             $tmp = $v;
             while($tmp & 0x80)
             {
                $tmp = $tmp << 1;
                ++$cnt;
              }
              $x = 0;
              while($x < $cnt && $n < strlen($data))
              {
                $s = substr($data, $n, 1);
                if((ord($s) & 0xC0) == 0x80)
                {
                   ++$n;
                   ++$x;
                 }else{
                         break;
                        }
                  }
                 if($x + 1 == $cnt)
                 {
                    $str  = $str . substr($data, $n - $cnt, $cnt);
                  }else{
                         while($n < strlen($data))
                        {
                          $s = substr($data, $n, 1);
                          if(ord($s) & 0x80)
                          {
                             ++$n;
                           }else{
                                    break;
                                 }
                            }
          }
         }else{
       $str = $str. $s;
       ++$n;
      }
}
return  $str;
}

関連する推奨事項:

utf8 文字または非 utf8 文字で 3 バイトを超える文字をフィルターする

PHP中国語以外の文字をフィルタリングして除外し、中国語の文字のみを保持する実装、

以上がPHP で UTF8 ではない文字を除外する方法 (コード)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。