ZipInputStream解壓中文文件名問題及解決方案
許多開發者在使用ZipInputStream
解壓包含中文文件名或文件夾名的Zip壓縮包時,常常遭遇字符編碼問題,導致解壓失敗,並提示類似“malformed input off : 1, length : 1”的錯誤。本文將深入分析此問題,並提供有效的解決方案。
問題根源在於ZipInputStream
構造方法中指定的字符集並非用於解壓文件內部文件名編碼,而是用於讀取Zip文件本身的中央目錄信息。中央目錄的編碼取決於壓縮包的創建環境和操作系統。 Windows系統通常使用GB2312或GBK編碼,而macOS和Linux系統通常使用UTF-8編碼。
因此,如果一個Zip壓縮包是在Windows系統下創建的,其中央目錄很可能使用GBK編碼。即使代碼中指定了UTF-8編碼, ZipInputStream
仍然無法正確解析GBK編碼的中央目錄,從而導致解壓失敗。
解決方案:
針對Windows系統創建的Zip包,建議使用GBK編碼讀取中央目錄:
FileInputStream input = new FileInputStream(targetPath); ZipInputStream zipInputStream = new ZipInputStream(new BufferedInputStream(input), Charset.forName("GBK"));
由於GBK編碼兼容GB2312,此方法同樣適用於GB2312編碼的中央目錄。
跨平台解決方案:
為了編寫更健壯的跨平台兼容代碼,推薦使用Apache Commons Compress庫。該庫提供更強大的壓縮/解壓縮功能,能夠自動處理不同編碼的Zip壓縮包,有效避免因字符集差異導致的解壓失敗。 它能自動檢測並處理不同編碼的中央目錄信息,簡化開發流程,並提升代碼的可靠性。
以上是ZipInputStream解壓中文文件名失敗?如何正確設置字符集?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

在使用IntelliJIDEAUltimate版本啟動Spring...

在使用MyBatis-Plus或其他ORM框架進行數據庫操作時,經常需要根據實體類的屬性名構造查詢條件。如果每次都手動...

Redis緩存方案如何實現產品排行榜列表的需求?在開發過程中,我們常常需要處理排行榜的需求,例如展示一個�...

將姓名轉換為數字以實現排序的解決方案在許多應用場景中,用戶可能需要在群組中進行排序,尤其是在一個用...

電商平台SKU和SPU表設計詳解本文將探討電商平台中SKU和SPU的數據庫設計問題,特別是如何處理用戶自定義銷售屬...

在Idea中如何設置SpringBoot項目默認運行配置列表在使用IntelliJ...


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

SublimeText3 Linux新版
SublimeText3 Linux最新版

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

禪工作室 13.0.1
強大的PHP整合開發環境

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。