PHP は非常に強力なプログラミング言語であり、開発者が使用できる文字列操作関数が豊富にあります。開発中、後続のデータ処理のために、中国語の文字を含む文字列を配列形式に変換する必要がある場合があります。この記事では、PHPの関数を使って中国語の文字列を配列に変換する方法を紹介します。
1. 文字列を Unicode エンコードに変換する
中国語の文字列を配列に変換する前に、まず Unicode エンコード形式に変換する必要があります。このステップを実行するには、PHP の mb_convert_encoding()
関数を使用します。
サンプル コード:
$str = '中文字符串'; $unicode_str = mb_convert_encoding($str, 'UCS-2LE', 'UTF-8');
上記のコードの $str
は、Unicode エンコード UCS-2LE# に変換する必要がある中国語の文字列です。 ## はターゲット エンコード形式、
UTF-8 はソース エンコード形式です。上記のコードを実行すると、取得された
$unicode_str は Unicode エンコード形式の文字列です。
unpack() 関数を使用して配列に変換できます。
$str = '中文字符串'; $unicode_str = mb_convert_encoding($str, 'UCS-2LE', 'UTF-8'); $unicode_arr = unpack('S*', $unicode_str);上記のコードでは、
$unicode_arr は変換された配列であり、その各要素は中国語の文字の Unicode エンコードを表します。ループ構造を利用して中国語文字列に戻すサンプルコードは次のとおりです:
$str = '中文字符串'; $unicode_str = mb_convert_encoding($str, 'UCS-2LE', 'UTF-8'); $unicode_arr = unpack('S*', $unicode_str); $str_arr = array(); foreach($unicode_arr as $code){ $str_arr[] = mb_convert_encoding(pack('S', $code), 'UTF-8', 'UCS-2LE'); } print_r($str_arr);上記コードでは、
$str_arr が変換後の中国語文字列です。ご覧のとおり、
pack() 関数を使用して Unicode エンコードを生のバイナリ データに解析し、
mb_convert_encoding() 関数を使用してエンコード変換を実行し、最終的に中国語のコードを取得しました。配列文字列としての文字形式。
以上がPHPは中国語の文字列を配列に変換しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。