php の mbstring 拡張モジュールは、マルチバイト文字処理機能を提供します。最も一般的に使用される方法は、 mbstring を使用してマルチバイト中国語文字を分割することです。これは php の拡張機能であるため、ハーフ文字の発生を回避できます。パフォーマンスも、一部のカスタム マルチバイト分割関数よりも優れています。
mbstring 拡張機能には、同様の関数を備えたいくつかの関数、mb_substr および mb_strcut が用意されています。マニュアルの説明を参照してください。
mb_substr
mb_substr() は、start パラメータと length パラメータで指定された str の部分を返します。
mb_substr() は、文字数に基づいてマルチバイトの安全な substr() 操作を実行します。位置は str の先頭から数えられます。最初の文字の位置は 0、2 番目の文字の位置は 1 などとなります。
mb_strcut
mb_strcut() は、start パラメーターと length パラメーターで指定された str の部分を返します。 .
mb_strcut() は、mb_substr() と同等の動作をメソッドが異なりますが、開始位置がマルチバイト文字の 2 バイト目以上の場合は、マルチバイト文字の 1 バイト目から開始されます。 >長さより短い文字列と、マルチバイト文字列の一部ではない文字、またはシフトシーケンスの途中ではない文字を str から減算します。
たとえば、mb_substr と mb_strcut を使用するテキストがあります。セグメンテーションに使用されます:
PLAIN TEXT
CODE:$str = '私は Chinese-www.webjx.com の比較的長い文字列です';
echo "mb_substr:" . mb_substr($str, 0, 6, 'utf-8');
echo "
";
echo "mb_strcut : " .mb_strcut($str, 0, 6, 'utf-8');
?>
出力結果は次のとおりです:
mb_substr: 私は比較の文字列です
です