Substr は文字列をインターセプトするために PHP でよく使用されますが、これを中国語の文字をインターセプトするために使用すると、次のような文字化けが発生します。
<?php $mystring="今天天气真好"; $mysubstring=substr($mystring,0,2); echo $mysubstring; ?>
出力結果is �; (推奨学習: PHP プログラミング入門から熟練度まで )
原因分析: substr 関数のプロトタイプは次のとおりです: string substr (string $string, int $ start [, int $length ] )、$length は返されるバイト長を表し、中国語の文字は 2 バイトを占めます。UTF-8 の中国語文字の場合、3 バイトとして扱われます。
<?php $length=strlen($mystring);echo $length;//输出结果为18 ?>
つまり、$length を 3 にすると、「Jin」という単語が正常に返されます。この場合、中国語と英語が混在している場合は、$length を慎重に計算する必要があります。
では、もっと良い解決策はあるのでしょうか? Php は追加関数 mb_strlen および mb_substr
<?php $length=mb_strlen($mystring); $mysub=mb_substr($mystring,0,4); echo "the length is:$length,","the substr is:$mysub"; ?>
出力結果は次のとおりです: 長さ: 6、部分文字列: 今日の天気
mb_strlen 関数 プロトタイプis int mb_strlen(string string_input, string encode); エンコードのデフォルトは UTF-8 で、UTF-8 でエンコードされた中国語の文字は
注: mb_strlen と mb_substr としてカウントされます。これらは PHP のコア関数ではありません。使用する前に、php.ini で extension=php_mbstring.dll を開く必要があります。
以上が文字化けのないPHP中国語インターセプト機能の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。