ホームページ  >  記事  >  バックエンド開発  >  php strlen mb_strlen は中国語と英語が混在した文字列の長さを計算します_PHP チュートリアル

php strlen mb_strlen は中国語と英語が混在した文字列の長さを計算します_PHP チュートリアル

WBOY
WBOYオリジナル
2016-07-21 15:45:311064ブラウズ

strlen と mb_strlen を比較してください
文字がすべて英語の場合、この 2 つは同じです。ここでは主に中国語と英語が混在した場合の 2 つの計算結果を比較します。 (テスト時のエンコード方式はUTF8です)

コードをコピー コードは以下の通りです:

$str='中国語1文字'
echo strlen($str) ;
echo '< ;br />';
echo mb_strlen($str,'UTF8');
//14
//6
?> 結果の分析: strlen を計算するとき, UTF8 として扱う 中国語の文字の長さは 3 なので、「中国語の 1 文字 1 文字」の長さは 3*4+2=14 です
mb_strlen を計算するとき、内部コードが UTF8 に選択されている場合、中国語の文字はは長さ 1 として計算されるため、「中国語 1 文字 1 文字」の長さは 6 です。
中国語と英語の混合文字列のプレースホルダー計算について:

これら 2 つの関数を使用すると、中国語と英語のプレースホルダーを共同で計算できます。英語の混合文字列 (中国語の文字のプレースホルダーは 2、英語の文字のプレースホルダーは 1)。計算方法は次のとおりです。混合文字列に中国語の文字と英語の文字が含まれる場合、プレースホルダーは次のようになります。
コードをコピーします
コードは次のとおりです:

$str='中国語 a 1 文字'; //計算は次のとおりですecho (strlen($str) + mb_strlen( $str,'UTF8')) / 2; echo
//出力結果
//10
?>


例えば、「中国語 1 文字」の strlen($str) の値は、 mb_strlen($str) の値が 6 の場合、「中国語の文字」を計算できます。 「1 つの記号」のプレースホルダーは 10 です。
Web サイトからの記事を添付します:
中国語に関する質問です。 PHP の組み込みの文字列長関数 strlen は、中国語の文字列を正しく処理できません。文字列が占有するバイト数のみを取得します。 GB2312 中国語エンコードの場合、strlen によって取得される値は中国語の文字数の 2 倍ですが、UTF-8 エンコードされた中国語の場合、その差は 3 倍になります (UTF-8 エンコードでは、1 つの中国語文字は 3 バイトを占めます)。

mb_strlen 関数を使用すると、この問題をより適切に解決できます。 mb_strlen の使用法は strlen と似ていますが、文字エンコーディングを指定する 2 番目のオプションのパラメーターがある点が異なります。たとえば、UTF-8 文字列 $str の長さを取得するには、mb_strlen($str,'UTF-8') を使用できます。 2 番目のパラメータを省略した場合は、PHP の内部エンコーディングが使用されます。内部エンコーディングは、mb_internal_encoding() 関数を通じて取得できます。 mb_strlen は PHP のコア関数ではないことに注意してください。これを使用する前に、php_mbstring.dll が php.ini にロードされていること、つまり「extension=php_mbstring.dll」という行が存在することを確認する必要があります。コメントアウトされていない場合は、関数の問題が未定義になります。


http://www.bkjia.com/PHPjc/320301.html

www.bkjia.com
tru​​e

http://www.bkjia.com/PHPjc/320301.html技術記事 strlen と mb_strlen を比較してください。文字がすべて英語の場合は同じです。ここでは主に中国語と英語が混在した場合の 2 つの計算結果を比較します。 (テスト時のエンコード方法は...
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。