ホームページ  >  記事  >  バックエンド開発  >  PHP の strlen と mb_strlen の違いについて話します。

PHP の strlen と mb_strlen の違いについて話します。

青灯夜游
青灯夜游オリジナル
2020-04-10 09:25:042239ブラウズ

PHP の strlen と mb_strlen の違いについて話します。

PHP では、strlen と mb_strlen は文字列の長さを調べる関数ですが、初心者にとってはマニュアルを読まないと違いがよくわからない場合があります。 。 2 つの違いについては、例を挙げて以下に説明します。

最初に例を見てください:

<?php  
//测试时文件的编码方式要是UTF8  
$str=&#39;中文a字1符&#39;;  
echo strlen($str).&#39;<br>&#39;;//14  
echo mb_strlen($str,&#39;utf8&#39;).&#39;<br>&#39;;//6  
echo mb_strlen($str,&#39;gbk&#39;).&#39;<br>&#39;;//8  
echo mb_strlen($str,&#39;gb2312&#39;).&#39;<br>&#39;;//10  
?>

結果分析: strlen を計算するとき、UTF8 の中国語文字は 3 つの長さとして扱われるため、「中国語の 1 文字 1 文字」の長さは 3* です。 4 2 =14、mb_strlen を計算するとき、内部コードが UTF8 に選択されている場合、漢字は 1 文字の長さとして計算されるため、「中国語 1 文字 1 文字」の長さは 6.

これら 2 つを使用します。この関数は、中国語と英語が混在した文字列の占有率を共同で計算できます (中国語の文字の占有率は 2、英語の文字の占有率は 1)。

echo (strlen($str) + mb_strlen($str,&#39;UTF8&#39;)) / 2;

たとえば、次の strlen 「中国語 1 文字 1 文字」($str) の値が 14、mb_strlen ($str) の値が 6 である場合、「中国語 1 文字 1 文字」のプレースホルダーは 10 であると計算できます。

echo mb_internal_encoding();

PHP の組み込みの文字列長関数 strlen は中国語の文字列を正しく処理できず、文字列が占有するバイト数のみを取得します。 GB2312 中国語エンコードの場合、strlen によって取得される値は中国語の文字数の 2 倍ですが、UTF-8 エンコードされた中国語の場合、その差は 3 倍になります (UTF-8 エンコードでは、1 つの中国語文字は 3 バイトを占めます)。

mb_strlen 関数を使用すると、この問題をより適切に解決できます。 mb_strlen の使用法は strlen と似ていますが、文字エンコーディングを指定する 2 番目のオプションのパラメーターがある点が異なります。たとえば、UTF-8 文字列 $str の長さを取得するには、mb_strlen($str,'UTF-8') を使用できます。 2 番目のパラメータを省略した場合は、PHP の内部エンコーディングが使用されます。内部エンコーディングは、mb_internal_encoding() 関数を通じて取得できます。

mb_strlen は PHP のコア関数ではないことに注意してください。これを使用する前に、php_mbstring.dll が php.ini にロードされていることを確認する必要があります。つまり、「extension」行が=php_mbstring.dll」が存在し、コメントアウトされていません。そうしないと、関数が未定義になる問題が発生します。

推奨学習: PHP ビデオ チュートリアル

以上がPHP の strlen と mb_strlen の違いについて話します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。