>  기사  >  Java  >  자바 문자와 바이트의 차이점은 무엇입니까

자바 문자와 바이트의 차이점은 무엇입니까

爱喝马黛茶的安东尼
爱喝马黛茶的安东尼원래의
2019-11-12 15:24:473422검색

자바 문자와 바이트의 차이점은 무엇입니까

바이트는 Java의 기본 데이터 유형인 바이트를 의미하며 1바이트는 8비트를 포함하므로 바이트 유형의 값 범위는 -128부터 127입니다.

일반적으로 텍스트가 아닌 파일(예: 그림, 사운드, 실행 파일)을 읽을 때 파일 내용을 저장하기 위해 바이트 배열이 필요합니다. 파일을 다운로드할 때 바이트 배열은 파일을 수신하기 위한 임시 버퍼로도 사용됩니다. 콘텐츠. 따라서 파일 작업에는 바이트가 필수적입니다. 파일을 쓰거나 읽을 때 사용됩니다.

일부 프로그램(특히 하드웨어 관련 프로그램)에서는 특정 데이터가 00110010과 같은 바이트 유형 변수에 저장됩니다. 여기서 각 비트는 매개변수를 나타내며, 비트 연산은 매개변수가 값 획득 및 할당 작업을 수행하는 데 사용됩니다.

기계는 바이트만 인식하지만 문자는 의미 단위입니다. 한 문자는 1, 2 또는 3 4바이트로 인코딩될 수 있습니다. 이는 문자 집합 인코딩과 관련이 있습니다. 영문자와 숫자는 싱글바이트이지만, 한자 등 자연어의 문자는 멀티바이트입니다. 1바이트는 255자만 표현할 수 있고, 전 세계적으로 이렇게 많은 자연어를 처리하는 데 사용할 수 없기 때문에 멀티바이트 저장이 꼭 필요합니다.

따라서 파일의 입력과 출력에서 ​​InputStream과 OutputStream은 바이트 스트림을 처리합니다. 즉, ANSI에 따르면 Reader와 Writer는 문자 스트림으로 간주됩니다. 코딩 표준, 구두점, 숫자, 대소문자가 모두 1바이트를 차지하고, 한자는 2바이트를 차지합니다. UNICODE 표준에 따르면 모든 문자는 2바이트를 차지합니다.

바이트:

1, 비트=1, 이진 데이터 0 또는 1.

2.바이트=8비트, 1바이트는 저장 공간의 기본 단위입니다.

3. 영문자 1개 = 1바이트 = 8비트. 영문자 1개는 1바이트, 즉 8비트입니다.

4. 한자 1개 = 2바이트 = 16비트. 한자 1자는 2바이트, 즉 16비트입니다.

문자:

Java는 문자를 표현하기 위해 유니코드를 사용합니다. Java의 문자는 2바이트입니다. 중국어나 영어 문자의 유니코드 인코딩은 2바이트를 차지하지만, 다른 인코딩 방법을 사용하는 경우 문자 수는 1개입니다. 점유된 바이트는 다양합니다.

GB 2312 인코딩 또는 GBK 인코딩에서는 영문자를 저장하려면 1바이트가 필요하고, 중국어 문자를 저장하려면 2바이트가 필요합니다.

UTF-8 인코딩에서는 영문자 하나를 저장하려면 1바이트가 필요하고, 한자 하나를 저장하려면 3~4바이트가 필요합니다.

UTF-16 인코딩에서는 영어 알파벳 문자 저장에 2바이트, 한자 저장에 3~4바이트가 필요합니다(유니코드 확장 영역의 일부 한자는 저장에 4바이트 필요).

UTF-32 인코딩에서는 전 세계 모든 문자를 저장하려면 4바이트가 필요합니다.

php 중국어 웹사이트, 수많은 무료 Java 입문 튜토리얼, 온라인 학습을 환영합니다!

위 내용은 자바 문자와 바이트의 차이점은 무엇입니까의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.