在做專案時碰到使用外語的情況下,我們就會使用UTF-8編碼。但是,在用PHP匯出CSV檔案時,如果寫入的資料是使用UTF-8編碼的日文、韓文之類的外文,就會出現亂碼。
要解決PHP產生CSV檔案的亂碼問題,只需要在檔案的開始輸出BOM頭,告訴windows CSV檔案的編碼方式,讓Excel開啟CSV時採用正確的編碼。
相關推薦:《php教學》
#什麼是BOM
在UCS 編碼中有一個叫做”ZERO WIDTH NO-BREAK SPACE”的字符,它的編碼是FEFF。而FFFE在UCS中是不存在的字符,所以就不應該出現在實際傳輸中。 UCS規範建議我們在傳輸位元組流前,先傳輸字元」ZERO WIDTH NO-BREAK SPACE」。這樣如果接收者收到FEFF,就表示這個位元組流是Big-Endian的;如果收到FFFE,就表示這個位元組流是Little-Endian的。
因此字元」ZERO WIDTH NO-BREAK SPACE」又被稱為BOM。 UTF-8不需要BOM來表示位元組順序,但可以用BOM來表示編碼方式。字符”ZERO WIDTH NO-BREAK SPACE”的UTF-8編碼是EF BB BF。所以如果接收者收到以EF BB BF開頭的位元組流,就知道這是UTF-8編碼了。 Windows就是使用BOM來標記文字檔的編碼方式的。
在所有內容輸出之前
print(chr(0xEF).chr(0xBB).chr(0xBF));
幾個UTF編碼的BOM頭
define ('UTF32_BIG_ENDIAN_BOM' , chr(0x00) . chr(0x00) . chr(0xFE) . chr(0xFF)); define ('UTF32_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE) . chr(0x00) . chr(0x00)); define ('UTF16_BIG_ENDIAN_BOM' , chr(0xFE) . chr(0xFF)); define ('UTF16_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE)); define ('UTF8_BOM' , chr(0xEF) . chr(0xBB) . chr(0xBF));
完整的程式碼:
header('Expires: 0'); header('Cache-control: private'); header('Cache-Control: must-revalidate, post-check=0, pre-check=0'); header('Content-Description: File Transfer'); header('Content-Encoding: UTF-8'); header('Content-type: text/csv; charset=UTF-8'); header('Content-Disposition: attachment;filename=Customers_Export.csv'); echo "\xEF\xBB\xBF"; // UTF-8 BOM // print(chr(0xEF).chr(0xBB).chr(0xBF));
以上是php輸出csv亂碼怎麼解決的詳細內容。更多資訊請關注PHP中文網其他相關文章!