>  기사  >  하나의 ASCII 문자가 몇 바이트를 차지합니까?

하나의 ASCII 문자가 몇 바이트를 차지합니까?

青灯夜游
青灯夜游원래의
2023-03-09 15:49:0523991검색

ASCII 문자 하나가 1바이트를 차지합니다. ASCII 코드 문자는 컴퓨터에서 7비트 또는 8비트 바이너리 인코딩으로 표현되며 1바이트로 저장됩니다. 즉, 하나의 ASCII 코드가 1바이트를 차지합니다. ASCII 코드는 표준 ASCII 코드와 확장 ASCII 코드로 나눌 수 있습니다. 표준 ASCII 코드는 7비트 이진수(나머지 1개의 이진수는 0)를 사용하여 대문자와 소문자를 모두 나타냅니다. 숫자 0~9. 미국 영어에 사용되는 구두점 및 특수 제어 문자입니다.

하나의 ASCII 문자가 몇 바이트를 차지합니까?

이 튜토리얼의 운영 환경: Windows 7 시스템, Dell G3 컴퓨터.

ASCII(American Standard Code for Information Interchange): 미국 정보 교환 표준 코드는 라틴 알파벳을 기반으로 한 컴퓨터 코딩 시스템으로, 주로 현대 영어와 기타 서유럽 언어를 표시하는 데 사용됩니다.

ASCII 코드는 지정된 7비트 또는 8비트 이진수 조합을 사용하여 128 또는 256개의 가능한 문자를 나타냅니다.

ASCII 코드 문자는 컴퓨터에서 7비트 또는 8비트 바이너리 인코딩으로 표현되며 1바이트로 저장됩니다. 즉, 하나의 ASCII 코드가 1바이트를 차지합니다.

하나의 ASCII 문자가 몇 바이트를 차지합니까?

ASCII 코드는 표준 ASCII 코드와 확장 ASCII 코드로 나눌 수 있습니다.

표준 ASCII 코드는 기본 ASCII 코드라고도 합니다. 이 코드는 7개의 이진수(나머지 1개의 이진수는 0)를 사용하여 모든 대문자와 소문자, 숫자 0~9 및 구두점을 나타냅니다. , 미국 영어에 사용되는 특수 제어 문자도 포함됩니다. 그 중: 标准ASCII码也叫基础ASCII码,使用7位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0到9、标点符号,以及在美式英语中使用的特殊控制字符。其中:

  • 0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符)

    如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;

    通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;

    ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。

  • 32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。

  • 65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。

同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。

后128个称为扩展ASCII码。

  • 0~31과 127(총 33개)은 제어 문자 또는 통신 전용 문자입니다(나머지는 표시 가능한 문자입니다)

    제어 문자 등: LF(라인 피드), CR(캐리지 리턴), FF(페이지 피드), DEL(삭제), BS(백스페이스), BEL(벨) 등

    통신용 특수 문자: SOH( 헤더), EOT(텍스트 끝), ACK(확인) 등
  • 32~126(총 95개)은 문자(32는 공백)이며, 그 중 48~57은 0부터 9까지의 10개의 아라비아 숫자입니다.
  • ASCII 테이블01 0100 0100 캐피털K0100 11000114 76# 0101 00010101 0010 0101 01 11 0101 01000101 01010101 01100101 01110101 10000x59Y대문자 Y0110 00000110 00010110 00100110 0011 01 10 01000110 0101
    ASCII 값 ​​8, 9, 10 및 13은 각각 백스페이스, 탭, 줄 바꿈 및 캐리지 리턴 문자로 변환됩니다. 특정 그래픽 표시가 없지만 응용 프로그램에 따라 텍스트 표시에 다른 효과가 있습니다.
    65~90은 영문 대문자 26자, 97~122는 영문 소문자 26자, 나머지는 구두점, 산술 기호 등입니다.
    또한 표준 ASCII에서는 가장 높은 비트(b7)가 패리티 비트로 사용된다는 점에 유의하세요. 소위 패리티 검사(parity check)는 코드 전송 중에 오류가 발생하는지 확인하는 데 사용되는 방법을 말하며 일반적으로 홀수 검사와 짝수 검사의 두 가지 유형으로 구분됩니다. 홀수 패리티는 다음을 규정합니다. 올바른 코드의 바이트에 있는 1의 수는 홀수여야 합니다. 홀수가 아닌 경우 가장 높은 비트 b7에 1을 추가합니다. 짝수 패리티는 다음을 규정합니다. 올바른 코드는 짝수여야 합니다. 짝수가 아닌 경우 가장 높은 비트 b7에 1을 추가합니다.
    의 마지막 128자를 확장 ASCII 코드라고 합니다. 많은 x86 기반 시스템은 확장(또는 "고급") ASCII 사용을 지원합니다. 확장 ASCII를 사용하면 각 문자의 8번째 비트를 사용하여 추가 128개의 특수 기호 문자, 외국 문자 및 그래픽 기호를 식별할 수 있습니다.
    ASCII 코드 표준 테이블은 다음과 같습니다
    Bin
    (바이너리)
    Oct
    (octal)
    12월
    (십진수)
    Hex
    (Hex)
    약어/문자
    설명
    0000
    00
    0x00
    NUL(널)
    널 문자
    0000 0001
    01
    0x01
    SOH(제목 시작)🎜🎜🎜🎜제목 시작🎜 🎜🎜🎜🎜 🎜0000 0010🎜🎜🎜🎜02🎜
    2
    0x02
    STX(텍스트 시작)
    텍스트 시작
    0000 0011
    03
    3
    0x03
    ETX (텍스트 끝)
    텍스트 끝
    0000 0100
    04
    4
    0x04
    EOT(전송 종료)
    전송 종료
    0000 0101
    05
    5
    0x05
    ENQ (문의)
    요청
    0000 0110
    06
    6
    0x06
    ACK(확인)
    알림 수신
    0000 0111
    07
    7
    0x07
    BEL(벨)
    Bell
    0000 1000
    010
    8
    0x08
    BS(백스페이스)
    돌아가기 Grid
    0000 1001
    011
    9
    0x09
    HT(가로 탭)
    가로 탭
    0000 1010
    012
    10
    0x0A
    LF(NL 라인피드, 줄바꿈)
    라인피드
    0 000 1011
    013
    11
    0x0B
    VT(세로 탭)
    세로 탭
    0000 1100
    014
    12
    0x0C
    FF(NP 양식 피드, 새 페이지)
    페이지 키
    0000 1101
    015
    13
    0x0D
    CR(캐리지 리턴)
    키 입력
    000 0 1110
    016
    14
    0x0E
    SO(시프트 아웃)
    전환할 필요 없음
    0000 1111
    017
    1 5 ​​
    0x0F
    SI (전환)
    전환 활성화
    0001 0000
    020
    16
    0x10
    DLE(데이터 링크 탈출)
    데이터 링크 탈출
    0001 0001
    021
    17
    0x11
    DC1(장치 제어 1)
    장치 제어 1
    0001 0010
    022
    18
    0x12
    DC2(장치 제어 2)
    장치 제어 2
    0001 0011
    023
    19
    0x13
    DC3(장치 제어 3)
    장치 제어 3
    0001 0100
    024
    20
    0x14
    DC4(장치 제어 4 )
    장치 제어 4
    0001 0101
    025
    21
    0x15
    NAK(부정 인정)
    수신 거부
    0001 0110
    026
    22
    0x16
    SYN(동기 유휴)
    동기 유휴
    0001 0111
    027
    23
    0x17
    ETB(거래 블록 끝)
    전송 차단 종료
    0001 1000
    030
    24
    0x18
    C AN (취소)
    Cancel
    0001 1001
    031
    25
    0x19
    EM(매체 끝)
    매체 끝
    0 001 1010
    032
    26
    0x1A
    SUB(대체)
    대신
    0001
    033
    27
    0x1B
    ESC( 탈출)
    탈출(오버플로)
    0001 1100
    034
    28
    0x1C
    FS(파일 구분 기호)
    파일 구분 기호
    0001 1101
    035
    29
    0x1D
    GS(그룹 구분 기호)
    그룹 기호
    0001 1110
    036
    30
    0x1E
    RS(레코드 구분 기호)
    레코드 구분 기호
    0001 1111
    037
    31
    0x1F
    US(단위 구분 기호)
    단위 구분 기호
    0010 0000
    040
    32
    0x20
    (공간)
    공간
    0010 0001
    041
    33
    0x21
    !
    느낌표
    0010 0010
    042
    34
    0x22
    "
    큰따옴표
    0010 0011
    043
    35
    0x23
    #
    해시태그
    0010 0100
    044
    36
    0x24
    $
    달러 기호
    0010 0101
    045
    37
    0x25
    %
    백분율
    0010 0110
    046
    38
    0x26
    &
    그리고#
    0010 0111
    047
    39
    0x27
    '
    작은따옴표 닫기
    0010 1000
    050
    40
    0x28
    (
    오픈 브래킷
    0010 1001
    051
    41
    0x29
    )
    닫는 괄호
    0010 1010
    052
    42
    0x2A
    *
    Star
    0010 1011
    053
    43
    0x2B
    +
    plus
    0010 1100
    054
    44
    0x2C
    ,
    쉼표
    0010 1101
    055
    45
    0x2D
    -
    마이너스/대시
    0010 1110
    056
    46
    0x2E
    .
    기간
    0010 1111
    057
    47
    0x2F
    /
    슬래시
    0011 0000
    060
    48
    0x30
    0
    문자 0
    0011 0001
    061
    49
    0x31
    1
    캐릭터 1
    0011 0010
    062
    50
    0x32
    2
    캐릭터 2
    0011 011
    063
    51
    0x33
    3
    캐릭터 3
    0011 0100
    064
    52
    0x34
    4
    캐릭터4
    0011 0101
    065
    53
    0x35
    5
    캐릭터 5
    0011 0110
    066
    54
    0x36
    6
    캐릭터 6
    0011 0111
    067
    55
    0x3 7
    7
    캐릭터 7
    0011 1000
    070
    56
    0x38
    8
    캐릭터 8
    0011 1001
    071
    57
    0x39
    9
    문자 9
    0011 1010
    072
    58
    0x3A
    :
    colon
    0011 1011
    073
    59
    0x3B
    ;
    세미콜론
    0011 1100
    074
    60
    0x3C
    미만
    0011 1101
    075
    61
    0x3D
    =
    등호
    00111110
    076
    62
    0x3E
    >
    0011 1111
    077
    63
    0x3F
    ?
    보다 큽니다.
    물음표
    0100 0000
    0100
    64
    0x40
    @
    이메일 기호
    0100 0001
    0101
    65
    0x41
    A
    대문자 A
    0100 0010
    0102
    66
    0x42
    B
    대문자 B
    0100 0011
    0100 01 01
    0105
    69
    0x45
    E
    캐피탈 E
    0100 0110
    0106
    70
    0x46
    F
    캐피탈 F
    0100
    0107
    71
    0x47
    G
    캐피털G
    0100 1000
    0110
    72
    0x48
    H
    캐피털H
    0100 1001
    0111
    73
    0x49
    I
    대문자 I
    01001010
    0112
    74
    0x4A
    J
    캐피털J ㅋㅋㅋ
    77
    0x4D
    M
    캐피탈 M
    0100 1110
    0116
    78
    0x4E
    N
    캐피털N
    0100 1111
    0117
    79
    0x4F
    O
    캐피탈O
    0101 20
    80
    0x50
    P
    캐피털P
    0121
    81
    0x51
    Q
    캐피탈Q
    0123
    83
    0x53
    S
    캐피탈 S
    0124
    84
    0x 54
    T
    캐피탈 T
    0125
    85
    0x55
    U
    캐피털U
    0126
    86
    0x56
    V
    캐피털V
    0127
    87
    0x57
    W
    대문자 W
    0130
    88
    0x58
    X
    대문자
    89
    0101 1010
    01 32
    90
    ㅋㅋㅋ 91
    0x5B
    [
    처방 브라켓
    0101 1100
    0134
    92
    0x5C
    속눈썹
    0101 1101
    0135
    93
    0x5D
    ]
    닫는 대괄호
    0101 1110
    0136
    94
    0x5E
    ^
    Caret
    0101 1111
    0137
    95
    0x5F
    _ 점수
    0140
    96
    0x60
    `
    작은따옴표 열기
    0141
    97
    0x61
    a
    낮음 케이스 a
    0142
    98
    0x62
    b
    소문자 b
    0143
    99
    0x63
    c
    소문자 c
    0144
    100
    0x64
    d
    소문자 d
    0145
    101
    0x65
    e
    소문자 e
    0110
    0146
    102
    0 x66
    f
    소문자 f
    0110 0111
    0147
    103
    0x67
    g
    소문자 g
    0110 1000
    0150
    104
    105
    0x69
    i
    소문자 i
    01101010
    0152
    106
    0x6A
    j
    소문자 j
    0110 1011
    0153
    107
    0x6B
    k
    소문자 k
    0110 1100
    0
    108
    0x6C
    l
    소문자 l
    0110 1101
    0155
    109
    0x6D
    m
    소문자 m
    0110 1110
    0156
    110
    0x6E
    n
    소문자 n
    0110 1 111
    0157
    111
    0x6F
    o
    소문자 o
    0111 0000
    0160
    112
    0 x70
    p
    소문자 p
    0111 0001
    0161
    113
    0 x71
    q
    소문자 q
    0111 0010
    0162
    114
    0x72
    r
    소문자 r
    0111 0011
    0163
    115
    11 6
    0x74
    t
    소문자 ㅋㅋㅋ0111 0101
    0165
    117
    0x75
    u
    소문자 u
    0111 0110
    0166
    118
    0x76
    v
    소문자 v
    0111
    0 167
    119
    0x77
    w
    소문자 w
    0111 1000
    0170
    120
    0x78
    x
    소문자 x
    0111 1001
    0171
    121
    0x79
    y
    소문자 y
    0111 1 010
    0172
    122
    0x7A
    z
    소문자 z
    0111 1011
    0173
    123
    0x7B
    {
    여는 괄호
    0111 1100
    0174
    124
    0 x 7C
    |
    세로선
    0111 1101
    0175
    125
    0x7D
    }
    괄호 닫기
    0111 1110
    0176
    126
    0x7E
    ~
    tilde
    0111 1111
    0177
    127
    0x7F
    DEL(삭제)
    delete

    크기 규칙

    일반적인 ASCII 코드의 크기 규칙: 숫자

    • 숫자는 문자보다 작습니다. 예를 들어 "7"

    • 숫자 0은 숫자 9보다 작으며 0부터 9까지 증가합니다. 예를 들어, "3"

    • 문자 A는 문자 Z보다 작고 A부터 Z까지 증가합니다. 예를 들어 "A"

    • 같은 글자의 대문자는 소문자보다 32자 더 작습니다. "A"

    몇 가지 일반적인 문자의 ASCII 코드 크기: "A"는 65이고 "0"은 48입니다.

    더 많은 관련 지식을 알고 싶다면 FAQ 칼럼을 방문해주세요!

위 내용은 하나의 ASCII 문자가 몇 바이트를 차지합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.