>  기사  >  한자 정보는 일반적으로 어떤 형식으로 컴퓨터에 저장됩니까?

한자 정보는 일반적으로 어떤 형식으로 컴퓨터에 저장됩니까?

青灯夜游
青灯夜游원래의
2021-01-26 14:34:1821099검색

한자 정보는 일반적으로 내부 코드 형태로 컴퓨터에 저장됩니다. "내부 코드"라고도 불리는 한자 내부 코드는 "한자 ASCII 코드"라고도 하며 컴퓨터 내부 저장, 한자 처리 및 전송에 사용되는 0과 1 기호로 구성된 코드를 말합니다.

한자 정보는 일반적으로 어떤 형식으로 컴퓨터에 저장됩니까?

이 튜토리얼의 운영 환경: Windows 7 시스템, Dell G3 컴퓨터.

한자 정보는 대개 내부 코드 형태로 컴퓨터에 저장됩니다.

입력 코드가 승인되면 사용된 키보드 입력 방법에 관계없이 한자 운영 체제의 "입력 코드 변환 모듈"에 의해 내부 코드로 변환됩니다. 기계내 코드는 한자의 가장 기본적인 인코딩으로, 한자 체계와 한자 입력 방법이 무엇이든 입력된 한자 외부 코드는 기계 내부에서 변환되어야 합니다. 다양한 방법으로 저장 및 처리됩니다.

자세한 설명

한자 처리 시스템은 한자와 서양 문자의 호환성을 보장해야 하기 때문에 시스템에 ASCII 코드와 한자 국가 표준 코드가 동시에 존재하면 모호성이 발생합니다. 예를 들어, 2바이트의 내용 30H와 21H가 있는데, 이는 한자 "ah"의 국가 표준 코드와 스페인어 "0" 및 "!"의 ASCII 코드를 나타낼 수 있습니다. 이러한 이유로 한자 기계내 코드를 적절하게 가공하여 국가표준 코드로 변환해야 합니다.

국가표준코드의 기계내코드는 2바이트 길이의 코드로 해당 국가표준코드의 각 바이트의 최상위 비트에 "1"을 붙인다. 즉,

한자 기계내 코드이다. = 한자 국가표준코드 + 8080H

예를 들어, 위에서 언급한 문자 "아"에 대한 국가표준 코드는 3021H이고, 내부 한자코드는 B0A1H이다.

한자 기계 코드의 기본은 한자 국가 표준 코드입니다.

기계내 코드: ASCII 코드와 국가 표준 코드를 동시에 사용할 때 모호성 문제를 피하기 위해 대부분의 한자 시스템은 국가 표준 코드의 각 바이트의 상위 위치 1을 기계 내 코드로 사용합니다. 한자의. 이는 한자 기계내 코드와 서양식 기계 내 코드 사이의 모호성을 해결할 뿐만 아니라, 한자 기계 내 코드와 국가 표준 코드가 매우 단순한 대응관계를 갖도록 한다.

한자 내부 코드, 국가 표준 코드 및 위치 코드의 관계는 다음과 같습니다. 위치 코드(10진수)의 2바이트를 16진수로 변환한 다음 2020H를 추가하여 해당 국가 표준 코드를 얻습니다. 한자 교환 코드(국가 표준 코드)의 2바이트 중 최상위 비트에 1을 추가합니다. 즉, 한자 교환 코드(국가 표준 코드)의 2바이트에 80H를 추가하여 해당 내부 코드를 얻습니다. 지역 코드 두 문자(10진수) 각 섹션을 16진수로 변환한 후 A0H를 추가하여 해당 내부 코드를 얻습니다.

더 많은 관련 기사를 보려면 PHP 중국어 웹사이트를 방문하세요! !

위 내용은 한자 정보는 일반적으로 어떤 형식으로 컴퓨터에 저장됩니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.