>  기사  >  유니코드와 ASCII의 차이점은 무엇입니까

유니코드와 ASCII의 차이점은 무엇입니까

青灯夜游
青灯夜游원래의
2021-10-15 13:50:3137528검색

차이점: 1. ASCII 인코딩은 1바이트인 반면 유니코드 인코딩은 일반적으로 2바이트입니다. 2. ASCII는 단일 바이트 인코딩이므로 중국어를 나타내는 데 사용할 수 없습니다. 유니코드는 모든 언어를 나타낼 수 있습니다. 3. 유니코드 인코딩에는 ASCII 인코딩보다 두 배의 저장 공간이 필요합니다.

유니코드와 ASCII의 차이점은 무엇입니까

이 튜토리얼의 운영 환경: Windows 7 시스템, Dell G3 컴퓨터.

ASCII 인코딩

  • ASCII 코드는 지정된 7비트 또는 8비트 이진수 조합을 사용하여 128 또는 256개의 가능한 문자를 나타냅니다. 기본 ASCII 코드라고도 하는 표준 ASCII 코드는 7개의 이진수(나머지 1개의 이진수는 0)를 사용하여 모든 대문자와 소문자, 숫자 0~9, 구두점 및 미국 영어 문자에 사용되는 특수 컨트롤을 나타냅니다. 마지막 비트는 패리티 검사에 사용됩니다.
  • 문제: ASCII는 단일 바이트 인코딩이므로 중국어를 나타내는 데 사용할 수 없습니다(중국어 인코딩에는 최소 2바이트가 필요함). 따라서 중국에서는 중국어를 인코딩하기 위해 GB2312 인코딩을 공식화했습니다. 하지만 세상에는 다양한 언어가 있으므로 통일된 인코딩이 필요합니다.

Unicode

  • 유니코드는 모든 언어를 일련의 인코딩으로 통합하므로 더 이상 잘못된 코드 문제가 발생하지 않습니다.
  • 유니코드는 문자를 표현하기 위해 가장 일반적으로 2바이트를 사용합니다(매우 희귀한 문자를 사용하려면 4바이트가 필요합니다). 최신 운영 체제와 대부분의 프로그래밍 언어는 유니코드를 직접 지원합니다.

유니코드와 ASCII의 차이

  • ASCII 인코딩은 1바이트인 반면 유니코드 인코딩은 일반적으로 2바이트입니다.
    문자 A의 ASCII 인코딩은 10진수로 65이고 유니코드로 01000001입니다. 앞에 0만 추가하면 됩니다. 즉, 00000000 01000001입니다.
  • 새로운 문제: 유니코드 인코딩으로 통합하면 문자가 깨지는 문제가 사라집니다. 그러나 작성하는 텍스트가 기본적으로 모두 영어인 경우 유니코드 인코딩은 ASCII 인코딩보다 두 배의 저장 공간을 필요로 하므로 저장 및 전송 측면에서 매우 비경제적입니다.

UTF8

  • 그래서 보존의 정신으로 유니코드 인코딩을 "가변 길이 인코딩"으로 변환하는 또 다른 UTF-8 인코딩이 있습니다.
  • UTF-8 인코딩은 유니코드 문자를 다양한 숫자 크기에 따라 1~6바이트로 인코딩하며, 일반적으로 사용되는 영문자는 1바이트로, 한자는 보통 3바이트로, 아주 희귀한 문자만 4-6바이트로 인코딩합니다. 6바이트. 전송하려는 텍스트에 영어 문자가 많이 포함되어 있는 경우 UTF-8 인코딩을 사용하면 공간을 절약할 수 있습니다.
문자 ASCII Unicode UTF-8
A 01000001 0000000001 01000001
中文 x 01001110 00101101 01001110 00101101
  • 또한 UTF-8 인코딩에는 추가적인 이점이 있다는 것을 알 수 있습니다. 즉, ASCII 인코딩은 실제로 UTF-8 인코딩의 일부로 간주될 수 있습니다. ASCII 인코딩. 레거시 소프트웨어는 UTF-8 인코딩에서 계속 작동할 수 있습니다.

컴퓨터에서 일반적인 문자 인코딩이 작동하는 방식

  • 유니코드 인코딩은 컴퓨터 메모리에서 균일하게 사용됩니다. 하드 디스크에 저장해야 하거나 전송해야 하는 경우 UTF-8 인코딩으로 변환됩니다.
  • 메모장으로 편집할 때 파일에서 읽은 UTF-8 문자는 유니코드 문자로 변환되어 메모리에 저장됩니다. 편집이 완료된 후 저장 시 유니코드가 UTF-8로 변환되어 파일에 저장됩니다.

    유니코드와 ASCII의 차이점은 무엇입니까
  • 웹을 탐색할 때 서버는 동적으로 생성된 유니코드 콘텐츠를 UTF-8로 변환한 다음 이를 브라우저로 전송합니다.

    유니코드와 ASCII의 차이점은 무엇입니까
더 많은 관련 지식을 보려면

FAQ 칼럼을 방문하세요!

위 내용은 유니코드와 ASCII의 차이점은 무엇입니까의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.