PHP 文字エンコーディングの問題: GB2312 VS UTF-8 の解決策
- WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBオリジナル
- 2016-06-21 08:54:001314ブラウズ
コードを確認します:
コードをコピーします コードは次のとおりです:
< html>
;/title>
" content=""/>
$string1 = "私は phper";
$string2 = "この Web サイトはスクリプト ホームです"; >echo "
";
print_r(str_split($string2,4));
予想通りのテスト結果が出ました -
中国語文字化け
なぜですか?なぜ?なぜ?なぜ?コード化けとは何ですか? %&! の文字化けしたコードとは何なのか説明してください。
英語の文字化けはなく、中国語の文字化けだけなので、最初にエンコードの問題を考えましたが、UTF-8 のエンコードは 3 バイト必要であることを思い出しました。死んだ馬!
したがって、print_r(str_split($string2,4)); この文の 4 は
6
に置き換えられています。結果を見てください。
同様に、エンコードされた文字セットの UTF-8 を GB2312 に変更してみることもできます。Unicode エンコードには 2 バイトが必要なので、互換性を維持したい場合は、Gb2312 エンコードの方がスペースを 1/3 節約できます。繁体字中国語、韓国語、日本語などの他の言語では、UTF-8 を使用する必要があります。
声明:この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。