>  기사  >  Java  >  Java에서 char은 몇 바이트를 차지합니까?

Java에서 char은 몇 바이트를 차지합니까?

coldplay.xixi
coldplay.xixi원래의
2020-10-26 09:19:1129596검색

Java에서 char이 차지하는 바이트 수: 1. Java의 내부 코드에 있는 char은 UTF16으로 인코딩되며, 1개의 char은 2바이트를 차지합니다. 2. Java의 외부 코드에서 char은 UTF8로 인코딩되고, 1개의 문자가 사용됩니다. [ 1~6] 바이트를 차지합니다.

Java에서 char은 몇 바이트를 차지합니까?

이 문제를 논의하기 전에 유니코드와 UTF를 구별해야 합니다.

  • 유니코드: 문자와 숫자 간의 매핑만 제공하는 통합 문자 번호입니다. 기호의 수는 지속적으로 증가하여 백만 개를 초과했습니다. 세부 정보: [https://zh.wikipedia.org/zh-cn/Unicode]

  • UTF: 유니코드 변환 형식. 유니코드로 된 숫자의 인코딩 방법을 정의합니다. UTF8과 UTF16은 두 가지 구현 방법입니다. 그 중 utf8은 가변 길이 표현으로 길이는 1~6바이트일 수 있으며, utf16은 가변 길이 표현으로 길이가 2~4바이트일 수 있습니다. 세부 정보: UTF8 [https://zh.wikipedia.org/zh-cn/UTF-8] UTF16 [https://zh.wikipedia.org/zh-cn/UTF-16]

다음으로 필요한 것은 내부 인코딩과 외부 인코딩을 구별합니다.

  • 내부 코드: 특정 언어가 실행 중일 때 메모리에 있는 char 및 문자열의 인코딩 방법입니다.

  • 외부 코드: 내부 코드를 제외하면 모두 외부 코드입니다.

소스코드 컴파일로 생성된 객체코드 파일(실행파일 또는 클래스 파일)의 인코딩 방식은 외래코드에 속한다는 점에 유의하시기 바랍니다.

먼저 내부 코드를 살펴보겠습니다

JVM의 내부 코드는 UTF16을 사용합니다. 초기에는 UTF16이 고정 길이 2바이트 방법을 사용하여 인코딩되었습니다. 2바이트는 65536개의 기호를 나타낼 수 있으며(실제로는 이보다 적게 나타낼 수 있음) 이는 당시 유니코드의 모든 문자를 표현하기에 충분했습니다. 그러나 유니코드의 문자 수가 증가함에 따라 UTF16에서는 2바이트 또는 4바이트를 사용하여 인코딩을 완료합니다. 이 상황을 처리하기 위해 Java는 향후 호환성 요구 사항을 고려하여 char 쌍을 사용하여 4바이트가 필요한 문자를 나타냅니다. 따라서 Java의 char은 2바이트를 차지하지만 일부 문자는 이를 표현하기 위해 2개의 문자가 필요합니다.

외국 코드

Java 클래스 파일은 UTF8을 사용하여 문자를 저장합니다. 즉, 클래스의 문자가 1~6바이트를 차지합니다.

Java 직렬화 중에 문자도 UTF8로 인코딩되며 1~6자를 차지합니다.

요약:

  • Java 내부 코드(실행 메모리)의 문자는 UTF16을 사용하여 인코딩됩니다. 문자 하나는 2바이트를 차지하지만 일부 문자는 표현하는 데 두 개의 문자가 필요합니다. 따라서 한 문자는 2바이트 또는 4바이트를 차지하게 됩니다.

  • Java 중국어 및 외국어 코드의 Char는 UTF8을 사용하여 인코딩되며, 한 문자는 1~6바이트를 차지합니다.

  • UTF16 인코딩에서 영어 문자는 대부분의 한자(특히 일반적으로 사용되는 한자)가 2바이트를 차지하고, 개별 한자(나중에 추가되는 유니코드 인코딩 한자는 일반적으로 거의 사용되지 않음)가 4바이트를 차지합니다. .

  • UTF8 인코딩에서는 영어 문자가 1바이트를 차지합니다. 대부분의 중국어 문자는 3바이트를 차지하며 일부 중국어 문자는 4바이트를 차지합니다.

EOF

관련 무료 학습 권장 사항: java 기본 튜토리얼

위 내용은 Java에서 char은 몇 바이트를 차지합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.