>  기사  >  ASCII 코드 파일에서 영문자는 몇 바이트를 차지합니까?

ASCII 코드 파일에서 영문자는 몇 바이트를 차지합니까?

藏色散人
藏色散人원래의
2021-11-22 15:07:0619515검색

ASCII 코드 파일에서는 영문자 1개가 1바이트를 차지하고, 한자 1자가 2바이트의 공간을 차지합니다. ASCII 코드는 지정된 7비트 또는 8비트 이진수 조합을 사용하여 128 또는 256개의 가능한 문자를 나타냅니다. 바이트는 이진 데이터의 단위이며 일반적으로 8비트 길이입니다.

ASCII 코드 파일에서 영문자는 몇 바이트를 차지합니까?

이 문서의 운영 환경: Windows 7 시스템, Dell G3 컴퓨터.

ASCII 코드 파일에서 영문자 하나는 몇 바이트를 차지하나요?

ASCII 코드에서는 영문자 하나(대소문자 구분 없이)가 1바이트의 공간을 차지하고, 한자 하나가 2바이트의 공간을 차지합니다.

ASCII:

ASCII((American Standard Code for Information Interchange): American Standard Code for Information Interchange)는 라틴 알파벳을 기반으로 한 컴퓨터 코딩 시스템으로, 주로 현대 영어와 기타 서유럽 언어를 표시하는 데 사용됩니다. 가장 일반적인 정보 교환 표준이며 국제 표준 ISO/IEC 646과 동일합니다. ASCII는 1967년에 표준화된 형태로 처음 공개되었으며, 1986년에 마지막으로 업데이트되었습니다. 지금까지 총 128개의 문자가 정의되었습니다.

ASCII 코드는 지정된 7비트 또는 8비트 이진수 조합을 사용하여 128 또는 256개의 가능한 문자를 나타냅니다. 기본 ASCII 코드라고도 하는 표준 ASCII 코드는 7개의 이진수(나머지 1개의 이진수는 0)를 사용하여 모든 대문자와 소문자, 숫자 0~9, 구두점 및 미국 영어에서 사용되는 특수 컨트롤을 나타냅니다. ] . 그 중:

0~31 및 127(총 33개)은 제어 문자 또는 통신 전용 문자(나머지는 표시 가능한 문자)입니다. 예를 들어 제어 문자: LF(줄 바꿈), CR(캐리지 리턴), FF( 페이지 피드), DEL(삭제), BS(백스페이스), BEL(링) 등 통신 특수 문자: SOH(텍스트 헤드), EOT(텍스트 끝), ACK(확인) 등; ​​8, 9, 10 및 13입니다. 각각 백스페이스, 탭, 줄 바꿈 및 캐리지 리턴 문자로 변환됩니다. 특정 그래픽 표시가 없지만 응용 프로그램에 따라 텍스트 표시에 다른 효과가 있습니다 [1].

32~126(총 95개)은 문자(32는 공백)이며, 그 중 48~57은 0부터 9까지의 10개의 아라비아 숫자입니다.

65~90은 영문 대문자 26자, 97~122는 영문 소문자 26자, 나머지는 구두점, 산술 기호 등입니다.

또한 표준 ASCII에서는 가장 높은 비트(b7)가 패리티 비트로 사용됩니다. 소위 패리티 검사(parity check)는 코드 전송 중에 오류가 발생하는지 확인하는 데 사용되는 방법을 말하며 일반적으로 홀수 검사와 짝수 검사의 두 가지 유형으로 구분됩니다. 홀수 패리티 규칙: 올바른 코드의 바이트에 있는 1의 수는 홀수여야 합니다. 홀수가 아닌 경우 가장 높은 비트에 1을 추가합니다. 짝수 패리티 규칙: 바이트에 있는 1의 수입니다. 올바른 코드는 짝수여야 합니다. 짝수가 아닌 경우 가장 높은 비트 b7에 1을 추가합니다.

마지막 128개를 확장 ASCII 코드라고 합니다. 많은 x86 기반 시스템은 확장(또는 "고급") ASCII 사용을 지원합니다. 확장 ASCII를 사용하면 각 문자의 8번째 비트를 사용하여 추가 128개의 특수 기호 문자, 외국어 문자 및 그래픽 기호를 결정할 수 있습니다.

바이트:

바이트는 바이너리 데이터의 단위입니다. 바이트의 길이는 일반적으로 8비트입니다. 그러나 일부 구형 컴퓨터 아키텍처에서는 다른 길이를 사용합니다. 혼동을 피하기 위해 대부분의 국제 문헌에서는 바이트 대신 바이트라는 단어가 사용됩니다. 대부분의 컴퓨터 시스템에서 바이트는 8비트 데이터 단위입니다. 대부분의 컴퓨터는 바이트를 사용하여 문자, 숫자 또는 기타 문자를 나타냅니다. 바이트는 일련의 이진 비트를 나타낼 수도 있습니다. 일부 컴퓨터 시스템에서 4바이트는 단어 1개를 나타내며, 이는 컴퓨터가 명령을 실행할 때 효율적으로 처리할 수 있는 데이터 단위입니다. 일부 언어 설명에서는 문자를 나타내기 위해 2바이트가 필요하며 이를 더블바이트 문자 세트라고 합니다. 일부 프로세서는 더블바이트 또는 싱글바이트 명령을 처리할 수 있습니다. 바이트는 종종 "B"로 축약되며 비트는 일반적으로 소문자 "b"로 축약됩니다. 컴퓨터 메모리의 크기는 일반적으로 바이트로 표시됩니다.

관련 지식이 더 궁금하시다면 FAQ 칼럼을 방문해 주세요!

위 내용은 ASCII 코드 파일에서 영문자는 몇 바이트를 차지합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.