한자 국가표준 코드는 각 한자에 대해 국가적으로 통일된 코드를 갖기 위해 한자 인코딩에 대한 국가 표준을 공포할 목적으로 1980년에 만들어졌습니다. 각 한자에는 한자 국가 표준 코드라고 하는 이진 코드가 있습니다. 우리나라의 한자 코드 표준 GB2312-80에는 바이너리 인코딩을 지정하는 일반적으로 사용되는 한자가 6763개 있습니다.
한자 교환 코드라고도 알려진 국가 표준 코드는 컴퓨터 간에 한자 정보를 교환할 때 사용되는 코드 표준입니다. 국가표준코드는 2바이트로 표현된다. 즉, 한자는 2바이트로 표현된다.
GB2312-80 GB2312는 코드 테이블을 첫 번째 바이트에 해당하는 94개의 영역으로 나눕니다. 각 영역은 두 번째 바이트에 해당하는 94비트를 가지며 두 바이트의 값은 지역 코드 값과 비트 번호 값입니다. 플러스 32(20H). 01~09 영역은 기호와 숫자, 16~87 영역은 한자, 10~15 및 88~94 영역은 추가 표준화가 필요한 공백 영역입니다. GB2312는 수집된 한자를 두 가지 수준으로 나눕니다. 첫 번째 수준에는 일반적으로 사용되는 3755개의 한자가 포함되어 있으며, 이는 16-55 영역에 배치되어 있으며 한어병음/획 모양의 순서로 배열되어 있습니다. 일반적으로 사용되는 3008개의 한자를 56~87자리에 부수/획순으로 배열하였습니다. 따라서 GB2312는 최대 6763개의 한자를 나타낼 수 있습니다.
위 내용은 한자의 국가표준코드는 몇 바이트의 저장바이트를 차지합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!