プロジェクトの実行中に外国語の使用に遭遇した場合は、UTF-8 エンコーディングを使用します。ただし、PHPを使用してCSVファイルをエクスポートする場合、UTF-8エンコーディングを使用して書かれたデータが日本語や韓国語などの外国語である場合、文字化けが発生します。
PHP によって生成された CSV ファイルの文字化けの問題を解決するには、ファイルの先頭に BOM ヘッダーを出力し、Windows に CSV ファイルのエンコード方法を指示するだけで、Excel で正しいコードを使用できるようになります。 CSVを開くときのエンコーディング。
関連する推奨事項: 「php チュートリアル 」
BOM とは
UCS エンコーディングではは「ZERO WIDTH NO-BREAK SPACE」という文字で、エンコーディングは FEFF です。 FFFE は UCS には存在しない文字ですので、実際の送信では出現しないはずです。 UCS 仕様では、バイト ストリームを送信する前に文字「ZERO WIDTH NO-BREAK SPACE」を送信することが推奨されています。このように、受信機が FEFF を受信した場合、バイト ストリームがビッグ エンディアンであることを示し、FFFE を受信した場合、バイト ストリームがリトル エンディアンであることを示します。
したがって、「ZERO WIDTH NO-BREAK SPACE」という文字は BOM とも呼ばれます。 UTF-8 では、バイト順序を示すために BOM は必要ありませんが、BOM を使用してエンコード方式を示すことができます。 「ZERO WIDTH NO-BREAK SPACE」という文字の UTF-8 エンコーディングは EF BB BF です。したがって、受信側が EF BB BF で始まるバイト ストリームを受信すると、それが UTF-8 でエンコードされていることを認識します。 Windows は、BOM を使用してテキスト ファイルのエンコーディングをマークします。
すべてのコンテンツが出力される前に
print(chr(0xEF).chr(0xBB).chr(0xBF));
いくつかのUTFでエンコードされたBOMヘッダー
define ('UTF32_BIG_ENDIAN_BOM' , chr(0x00) . chr(0x00) . chr(0xFE) . chr(0xFF)); define ('UTF32_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE) . chr(0x00) . chr(0x00)); define ('UTF16_BIG_ENDIAN_BOM' , chr(0xFE) . chr(0xFF)); define ('UTF16_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE)); define ('UTF8_BOM' , chr(0xEF) . chr(0xBB) . chr(0xBF));
完全なコード:
header('Expires: 0'); header('Cache-control: private'); header('Cache-Control: must-revalidate, post-check=0, pre-check=0'); header('Content-Description: File Transfer'); header('Content-Encoding: UTF-8'); header('Content-type: text/csv; charset=UTF-8'); header('Content-Disposition: attachment;filename=Customers_Export.csv'); echo "\xEF\xBB\xBF"; // UTF-8 BOM // print(chr(0xEF).chr(0xBB).chr(0xBF));
以上がPHPから出力されたCSVが文字化けする問題を解決する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。