首頁 >Java >Java基礎 >java中將查詢的資料以csv檔案匯出時出現亂碼

java中將查詢的資料以csv檔案匯出時出現亂碼

王林原創: 2019-12-04 15:46:412623瀏覽

一、問題

將查詢的資料以xls檔案匯出時（UTF-8編碼），資料正常；但以CSV檔案匯出時，檔案中的中文亂碼，同樣是UTF-8編碼，改成GBK編碼匯出時，中文顯示正常。

本來以為問題解決，後面匯出含拉丁字元（如ÀÆÊàÌ）的資料時，以xls檔案匯出資料正常顯示，以CSV檔案匯出時，檔案中的拉丁文字元顯示為「？」號。

相關影片教學推薦：java課程

二、解決方法

以CSV方式匯出的檔案中預設不含BOM訊息，透過給將要輸出的內容設定BOM標識(以EF BB BF 開頭的位元組流)即可解決此問題。

具體方法如下：

...
OutputStreamWriter outputStreamWriter = new OutputStreamWriter(response.getOutputStream(), "UTF-8");  
// 要输出的内容  
result = (String)contentMap.get(RESPONSE_RESULT);  
response.setHeader("Content-Disposition", "attachment;filename=test.csv");  
outputStreamWriter.write(new String(new byte[]{(byte) 0xEF, (byte) 0xBB, (byte) 0xBF}));  
outputStreamWriter.write(result);  
outputStreamWriter.flush();

如果是以OutputStream流實作的，參數可以如下修改：

out = response.getOutputStream();     
//加上UTF-8文件的标识字符      
out.write(new byte []{(byte) 0xEF, (byte) 0xBB, (byte) 0xBF});

註：

BOM： Byte Order Mark，字節順序標記（以下摘自百度百科）

在UCS 編碼中有一個叫做“Zero Width No-Break Space” ，中文譯名為“零寬無間斷間隔”的字符，它的編碼是FEFF。而 FFFE 在 UCS 中是不存在的字符，所以不應該出現在實際傳輸中。

UCS 規範建議我們在傳輸位元組流前，先傳送字元“Zero Width No-Break Space”，這樣如果接收者收到FEFF，就表示這個位元組流是Big-Endian 的；如果收到FFFE，就表示這個位元組流是Little- Endian 的。

因此字元 “Zero Width No-Break Space（零寬無間斷間隔）” 又被稱為 BOM。

UTF-8 不需要 BOM 來表示位元組順序，但可以用 BOM 來表示編碼方式。字元 “Zero Width No-Break Space” 的 UTF-8 編碼是 EF BB BF。所以如果接收者收到以 EF BB BF 開頭的位元組流，就知道這是 UTF-8編碼了。

Windows 就是使用 BOM 來標記文字檔案的編碼方式的。

相關文章教學推薦：java入門學習

以上是java中將查詢的資料以csv檔案匯出時出現亂碼的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述：

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

上一篇：java避免讀取文件亂碼的方法下一篇：java避免讀取文件亂碼的方法

看更多