In diesem Artikel werden hauptsächlich relevante Informationen zur Analyse der Anzahl der Bytes, die Zeichen in Java belegen, vorgestellt. Freunde, die sie benötigen, können sich auf
Beispielanalyse der Anzahl der Bytes, die Zeichen in Java belegen
1: „Byte“ ist Byte, „Bit“ ist Bit
2: 1 Byte = 8 Bit; >
Char ist in Java 2 Bytes. Java verwendet Unicode, 2 Bytes (16 Bit), um ein Zeichen darzustellen.
Der Beispielcode lautet wie folgt:
public class Test { public static void main(String[] args) { String str= "中"; char x ='中'; byte[] bytes=null; byte[] bytes1=null; try { bytes = str.getBytes("utf-8"); bytes1 = charToByte(x); } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block e.printStackTrace(); } System.out.println("bytes 大小:"+bytes.length); System.out.println("bytes1大小:"+bytes1.length); } public static byte[] charToByte(char c) { byte[] b = new byte[2]; b[0] = (byte) ((c & 0xFF00) >> 8); b[1] = (byte) (c & 0xFF); return b; } }
Laufergebnis:
Bytes1 Größe: 2
Java verwendet Unicode zur Darstellung von Zeichen. Der Unicode des chinesischen Zeichens „中“ beträgt 2 Bytes.
Die String.getBytes(encoding)-Methode dient dazu, die Byte-
-Darstellung der angegebenen Codierung zu erhalten,
Normalerweise ist gbk/gb2312 2 Bytes, UTF-8 ist 3 Bytes.
Wenn keine Kodierung angegeben ist, wird die Standardkodierung des Systems verwendet.
Das obige ist der detaillierte Inhalt vonBeispielcode zum Parsen, wie viele Bytes char in Java belegt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!