stringの長さを計算するためにPHPで使用される一般的な関数は、strlenとmb_strlenです。文字がすべて英語の場合、それらは同じです。ここでは主に中国語と英語が混在した場合の 2 つの計算結果を比較します。
PHP では、strlen と mb_strlen は文字列の長さを調べる関数です。成功すると、文字列の長さが返されます。 0を返します。 mb_strlen — 文字列の長さを取得します。Syntaxmb_strlen ($str, $encoding)str
長さをチェックする文字列。
encoding パラメータは文字エンコーディングです。省略した場合は、内部文字エンコーディングが使用されます。
戻り値
文字列strに含まれる文字数をエンコードエンコードで返します。 マルチバイト文字は 1 としてカウントされます。
指定されたエンコーディングが無効な場合は FALSE を返します。以下は 2 つの違いを説明する例です。
最初に例を見てください:
<?php //测试时文件的编码方式要是UTF8 $str='中文a字1符'; echo strlen($str).'<br>';//14 echo mb_strlen($str,'utf8').'<br>';//6 echo mb_strlen($str,'gbk').'<br>';//8 echo mb_strlen($str,'gb2312').'<br>';//10 ?>結果分析: strlen を計算するとき、UTF8 の漢字は 3 つの長さとして扱われるため、「中国語の 1 文字」の長さは 3*4+2=14 と計算されます。 in mb_strlen 内部コードがUTF8に選択されている場合、中国語の文字は長さ1として計算されるため、「中国語の文字1文字」の長さは6になります。これら2つの関数を使用すると、中国語の文字を結合して計算できます。と英語が混在しています 配置された文字列のプレースホルダーは何ですか (中国語の文字のプレースホルダーは 2、英語の文字のプレースホルダーは 1)
echo (strlen($str) + mb_strlen($str,'UTF8')) / 2;たとえば、「中国語の文字 1」の strlen($str) 値「文字」が 14、mb_strlen($str) の値が 6 である場合、「中国語 1 文字 1 文字」の占有率は 10 であると計算できます。
echo mb_internal_encoding();PHP の組み込み文字列長関数 strlen は中国語を正しく処理できませんstring が占めるバイト数のみを取得します。 GB2312 中国語エンコードの場合、strlen によって取得される値は中国語の文字数の 2 倍ですが、UTF-8 エンコードされた中国語の場合、その差は 3 倍になります (UTF-8 エンコードでは、1 つの中国語文字は 3 バイトを占めます)。 mb_strlen 関数を使用すると、この問題をより適切に解決できます。 mb_strlen の使用法は strlen と似ていますが、文字エンコーディングを指定する 2 番目のオプションのパラメーターがある点が異なります。たとえば、UTF-8 文字列 $str の長さを取得するには、mb_strlen($str,'UTF-8') を使用できます。 2 番目のパラメータを省略した場合は、PHP の内部エンコーディングが使用されます。内部エンコーディングは、mb_internal_encoding() 関数を通じて取得できます。 mb_strlen は PHP のコア関数ではないことに注意してください。これを使用する前に、php_mb
string
.dll が php.ini にロードされていることを確認する必要があります。つまり、「extension=」という行が含まれていることを確認する必要があります。 php_mbstring.dll" は存在しますが、コメント化されていません そうしないと、未定義の関数の問題が発生します。
以上がPHPのstrlenとmb_strlenの違いをご存知ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。