PHP には文字列の数を数える関数が 2 つあります
1 つは strlen で、もう 1 つは mb_strlen です。
まずはマニュアルの定義を見てみましょう
strlen
strlen — 文字列の長さを取得します
int strlen ( string $string )
指定された文字列 string の長さを返します。
mb_strlen
int mb_strlen ( string $str [, string $encoding ] )
指定された文字列 string の長さを返します。
encodingパラメータは文字エンコーディングです。省略した場合は、内部文字エンコーディングが使用されます。
mb_strlen が文字エンコーディングを渡せること以外に違いはないようです。 以下に両者の違いを説明する例を示します。
最初に例を見てください:
コードをコピーします コードは次のとおりです:
$str='中国語文字 1 文字';
echo strlen ($str).'
';//14
echo mb_strlen($str,'utf8').'
';//6
echo mb_strlen( $str,'gbk').'
';//8
echo mb_strlen($str,'gb2312').'
';//10
結果分析: strlen を計算するときは、UTF8 で扱います。中国語の文字の長さは 3 です。したがって、mb_strlen を計算するとき、内部コードが UTF8 として選択されている場合、中国語の文字 1 文字の長さは 3*4+2=14 となります。文字の長さは 1 として計算されます。 したがって、「中国語 1 文字 1 文字」の長さは 6 です。
これら 2 つの関数を使用すると、中国語と英語が混在した文字列の占有率 (中国語の占有率) を共同で計算できます。文字は 2、英語の文字の占有率は 1)
コードをコピーします コードは次のとおりです:
echo (strlen($str) + mb_strlen($str,'UTF8')) / 2;
たとえば、「中国語 1 文字 1 文字」の strlen($str) 値が 14、mb_strlen($str) 値が 6 である場合、「中国語 1 文字 1 文字」のプレースホルダは次のように計算できます。 」は10です。
コードをコピーします コードは次のとおりです:
echo mb_internal_encoding();
PHP の組み込み文字列長関数 strlen は、文字列によって占有されているバイト数のみを正しく処理できません。 。 GB2312 中国語エンコードの場合、strlen によって取得される値は中国語の文字数の 2 倍ですが、UTF-8 エンコードされた中国語の場合、その差は 3 倍になります (UTF-8 エンコードでは、1 つの中国語文字は 3 バイトを占めます)。
mb_strlen 関数を使用すると、この問題をより適切に解決できます。 mb_strlen の使用法は strlen と似ていますが、文字エンコーディングを指定する 2 番目のオプションのパラメーターがある点が異なります。たとえば、UTF-8 文字列 $str の長さを取得するには、mb_strlen($str,'UTF-8') を使用できます。 2 番目のパラメータを省略した場合は、PHP の内部エンコーディングが使用されます。内部エンコーディングは、mb_internal_encoding() 関数を通じて取得できます。
mb_strlen は PHP のコア関数ではないことに注意してください。Windows で使用する前に、php_mbstring.dll が php.ini にロードされていることを確認する必要があります。つまり、「extension=php_mbstring.dll」という行が含まれていることを確認する必要があります。 dll" が存在し、コメントアウトされていません。それ以外の場合は、未定義の関数の問題が発生しました。この拡張機能は Linux でコンパイルする必要があります。
http://www.bkjia.com/PHPjc/736785.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/736785.html技術記事 PHP には文字列の数を計算する関数が 2 つあり、1 つは strlen で、もう 1 つは mb_strlen です。まず、マニュアル strlen の定義 strlen を見てみましょう。文字列の長さを取得します int strlen ( string $st.. .