ホームページ >バックエンド開発 >PHPチュートリアル >PHP 文字エンコーディングの問題: GB2312 VS UTF-8_PHP チュートリアル

PHP 文字エンコーディングの問題: GB2312 VS UTF-8_PHP チュートリアル

WBOY
WBOYオリジナル
2016-07-13 17:44:021063ブラウズ

今日は本に従ってコードを書きました。コードの目的は、str_split() 関数を使用して文字列を配列に分割することです。英語で話すのは簡単ですが、中国語を分割するときに問題があります。 (中国語ユニット 2 台とアレイユニット 1 台)——

コードを見てください:

>http://www.w3.org/TR/html4/loose.dtd"> ;

新しいドキュメント

<メタ名="著者" コンテンツ=""/>

<メタ名="キーワード" コンテンツ=""/>

<メタ名="説明" コンテンツ=""/>

$string1 = "私はphperです";

$string2 = "この本はブルー オーシャン戦略についてです";

print_r(str_split($string1));

エコー "
";

print_r(str_split($string2,4));

?>

テスト結果は予想通りでした - 中国語文字化け

なぜ?なぜ?なぜ?なぜ?コード化けとは何ですか? %&! の文字化けしたコードとは何なのか説明してください。

英語の文字化けはなく、中国語の文字化けだけだったので、最初にエンコードの問題について考えましたが、UTF-8 エンコードには 3 バイトが必要であることを突然思い出しました。死んだ馬のように扱いましょう。

つまり、 print_r(str_split($string2,4)); この文の 4 は 6 に置き換えられたので、結果を見てください

同様に、エンコードされた文字セットの UTF-8 を GB2312 に変更してみることもできます。Unicode エンコードには 2 バイトが必要なので、Gb2312 エンコードは UTF-8 よりも 1/3 のスペースを節約できますが、互換性を持たせたい場合は、繁体字中国語、韓国語、日本語などの他の言語では、UTF-8 を使用する必要があります。

ところで、私は最初のダイナミックな音楽を発見したので、それを皆さんと共有したいと思います: PHP 文字エンコーディングの問題: GB2312 VS UTF-8_PHP チュートリアル

―大丈夫ですか?

—大丈夫です!

PHP 文字エンコーディングの問題: GB2312 VS UTF-8_PHP チュートリアル

http://www.bkjia.com/PHPjc/478805.html

www.bkjia.com

tru​​e

http://www.bkjia.com/PHPjc/478805.html

技術記事

今日はこの本に基づいてコードを書きました。コードの目的は、str_split() 関数を使用して文字列を配列に分割することです。ただし、中国語 (2 つの中国語の文字と 1 つの配列) を分割する場合は、単位)...

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。