搜尋
首頁Javajava教程Java字元編碼實例分析
Java字元編碼實例分析May 09, 2023 pm 02:13 PM
java

1、Java檔案編譯後形成class

這裡Java檔案的編碼可能有多種多樣,但Java編譯器會自動將這些編碼依照Java檔案的編碼格式正確讀取後產生class文件,這裡的class檔案編碼是Unicode編碼(具體說是UTF-16編碼)。

因此,在Java程式碼中定義一個字串:

String s="漢字";

不管在編譯前java檔案使用何種編碼,在編譯後成class後,他們都是一樣的----Unicode編碼表示。

2、JVM中的編碼

JVM載入class文件讀取時候使用Unicode編碼方式正確讀取class文件,那麼原來定義的String s="漢字";在記憶體中的表現形式是Unicode編碼。

當呼叫String.getBytes()的時候,其實已經為亂碼買下了禍根。因為此方法使用平台預設的字元集來取得字串對應的位元組數組。在WindowsXP中文版中,使用的預設編碼是GBK,不信運行下:

public class Test {   public static void main(String[] args) {   System.out.println("当前JRE:" + System.getProperty("java.version"));   System.out.println("当前JVM的默认字符集:" + Charset.defaultCharset());   }   }

目前JRE:1.6.0_16

目前JVM的預設字元集:GBK

當不同的系統、資料庫經過多次編碼後,如果對其中的原理不理解,就容易導致亂碼。因此,在一個系統中,有必要對字串的編碼做一個統一,這個統一模糊點說,就是對外統一。例如方法字串參數,IO流,在中文系統中,可以統一使用GBK、GB13080、UTF-8、UTF-16等等都可以,只是要選擇有些更大字符集,以確保任何可能用到的字符都可以正常顯示,避免亂碼的問題。 (假設對所有的檔案都用ASCII碼)那就無法實現雙向轉換了。

要特別注意的是,UTF-8並非能容納了所有的中文字元集編碼,因此,在特殊情況下,UTF-8轉GB18030可能會出現亂碼,然而一群傻B常常在做中文系統喜歡用UTF-8編碼而不說不出個所以然出來!最傻B的是,一個系統多個人做,原始碼檔案有的人用GBK編碼,有人用UTF-8,還有人用GB18030。 FK,都是中國人,也不是外包項目,用什麼UTF-8啊,神經!原始碼統統都用GBK18030就OK了,免得ANT腳本編譯時候提示不可認的字元編碼。

因此,對於中文系統來說,***選擇GBK或GB18030編碼(其實GBK是GB18030的子集),以便***限度的避免亂碼現象。

3、記憶體中字串的編碼

記憶體中的字串不僅限於從class程式碼直接載入而來的字串,還有一些字串是從文字檔案中讀取的,還有的是透過資料庫讀取的,還有可能是從位元組數組建構的,然而他們基本上都不是Unicode編碼的,原因很簡單,儲存優化。

因此需要處理各種各樣的編碼問題,在處理之前,必須先明確「來源」的編碼,然後用指定的編碼方式正確讀取到記憶體中。如果是方法的參數,實際上必須明確該字串參數的編碼,因為這個參數可能是另外一個日文系統傳遞過來的。當明確了字串編碼時候,就可以按照要求正確處理字串,以避免亂碼。

在對字串進行解碼編碼的時候,應該呼叫下面的方法:

getBytes(String charsetName)   String(byte[] bytes, String charsetName)

以上是Java字元編碼實例分析的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:亿速云。如有侵權,請聯絡admin@php.cn刪除
带你搞懂Java结构化数据处理开源库SPL带你搞懂Java结构化数据处理开源库SPLMay 24, 2022 pm 01:34 PM

本篇文章给大家带来了关于java的相关知识,其中主要介绍了关于结构化数据处理开源库SPL的相关问题,下面就一起来看一下java下理想的结构化数据处理类库,希望对大家有帮助。

Java集合框架之PriorityQueue优先级队列Java集合框架之PriorityQueue优先级队列Jun 09, 2022 am 11:47 AM

本篇文章给大家带来了关于java的相关知识,其中主要介绍了关于PriorityQueue优先级队列的相关知识,Java集合框架中提供了PriorityQueue和PriorityBlockingQueue两种类型的优先级队列,PriorityQueue是线程不安全的,PriorityBlockingQueue是线程安全的,下面一起来看一下,希望对大家有帮助。

完全掌握Java锁(图文解析)完全掌握Java锁(图文解析)Jun 14, 2022 am 11:47 AM

本篇文章给大家带来了关于java的相关知识,其中主要介绍了关于java锁的相关问题,包括了独占锁、悲观锁、乐观锁、共享锁等等内容,下面一起来看一下,希望对大家有帮助。

一起聊聊Java多线程之线程安全问题一起聊聊Java多线程之线程安全问题Apr 21, 2022 pm 06:17 PM

本篇文章给大家带来了关于java的相关知识,其中主要介绍了关于多线程的相关问题,包括了线程安装、线程加锁与线程不安全的原因、线程安全的标准类等等内容,希望对大家有帮助。

Java基础归纳之枚举Java基础归纳之枚举May 26, 2022 am 11:50 AM

本篇文章给大家带来了关于java的相关知识,其中主要介绍了关于枚举的相关问题,包括了枚举的基本操作、集合类对枚举的支持等等内容,下面一起来看一下,希望对大家有帮助。

详细解析Java的this和super关键字详细解析Java的this和super关键字Apr 30, 2022 am 09:00 AM

本篇文章给大家带来了关于Java的相关知识,其中主要介绍了关于关键字中this和super的相关问题,以及他们的一些区别,下面一起来看一下,希望对大家有帮助。

Java数据结构之AVL树详解Java数据结构之AVL树详解Jun 01, 2022 am 11:39 AM

本篇文章给大家带来了关于java的相关知识,其中主要介绍了关于平衡二叉树(AVL树)的相关知识,AVL树本质上是带了平衡功能的二叉查找树,下面一起来看一下,希望对大家有帮助。

java中封装是什么java中封装是什么May 16, 2019 pm 06:08 PM

封装是一种信息隐藏技术,是指一种将抽象性函式接口的实现细节部分包装、隐藏起来的方法;封装可以被认为是一个保护屏障,防止指定类的代码和数据被外部类定义的代码随机访问。封装可以通过关键字private,protected和public实现。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具