char既然代表了一个字符,就应该能存放所有的字符才对呀,加上乱七八糟的各国语言字符,总不能char只能存放 中日韩的单个字符吧?
PHPz2017-04-17 17:48:01
Java는 유니코드 인코딩만 사용하므로 char는 한자를 저장할 수 있습니다.
유니코드(중국어: Universal Code, International Code, Unicode, Unicode)는 컴퓨터 과학 분야의 산업 표준입니다. 이는 전 세계 대부분의 쓰기 시스템을 구성하고 코딩하므로 컴퓨터가 더 간단한 방식으로 텍스트를 표시하고 처리할 수 있습니다.
유니코드는 범용 문자 집합의 표준을 바탕으로 개발되었으며 책으로도 출판되었습니다[1]. 유니코드는 오늘날까지도 지속적으로 개정되고 있으며 각 새 버전에는 더 많은 새로운 문자가 추가됩니다. 최신 버전은 2015년 6월 17일에 출시된 8.0.0[1]으로, 100,000자 이상을 수용했습니다(2005년에 100,000자가 채택됨). 시각적 문자 모양, 인코딩 방법 및 표준 문자 인코딩 외에도 유니코드가 다루는 데이터에는 대문자 및 소문자와 같은 문자 특성도 포함됩니다.
위 내용은 위키피디아 유니코드-Wikipedia에서 따온 것입니다
유니코드로 된 것들은 자유롭지 않고 유니코드 조직에 의해 포함되어야 한다는 것을 위에서 보면 어렵지 않게 알 수 있습니다. 그러나 지금은 중국어, 일본어, 한국어 문자 중 일부만 포함되어 완전하지 않을 수 있습니다. . 그리고 Java는 유니코드를 사용하므로 Java는 유니코드 조직에 포함되어 있는 한 이러한 문자를 지원합니다.
아주 좋은 답변은 아닙니다.
黄舟2017-04-17 17:48:01
Char는 문자+구두점 2바이트이면 문자를 표현하기에 충분하기 때문에 2바이트를 사용하여 저장되지만, 영어가 아닌 다른 텍스트, 중국어 등을 추가하면 4바이트로는 부족할 수 있습니다. 문자는 표현할 수 있는 범위가 늘어나 이론적으로 8바이트도 가능합니다.
유니코드 문자셋 표준이 생겼습니다
Java의 문자는 유니코드 인코딩, 16비트를 사용합니다