Maison >Problème commun >Combien d'octets un caractère ascii occupe-t-il ?

Combien d'octets un caractère ascii occupe-t-il ?

青灯夜游
青灯夜游original
2023-03-09 15:49:0524066parcourir

Un caractère ascii occupe 1 octet. Les caractères du code ASCII sont représentés par un codage binaire 7 bits ou 8 bits dans l'ordinateur et sont stockés dans un octet, c'est-à-dire qu'un code ASCII occupe un octet. Le code ASCII peut être divisé en code ASCII standard et code ASCII étendu. Le code ASCII standard est également appelé code ASCII de base. Il utilise des nombres binaires de 7 bits (le chiffre binaire restant est 0) pour représenter toutes les lettres majuscules et minuscules. chiffres de 0 à 9. Signes de ponctuation et caractères de contrôle spéciaux utilisés en anglais américain.

Combien d'octets un caractère ascii occupe-t-il ?

L'environnement d'exploitation de ce tutoriel : système Windows 7, ordinateur Dell G3.

ASCII (American Standard Code for Information Interchange) : L'American Standard Code for Information Interchange est un système de codage informatique basé sur l'alphabet latin, principalement utilisé pour afficher l'anglais moderne et d'autres langues d'Europe occidentale.

Le code ASCII utilise une combinaison de nombres binaires spécifiée de 7 ou 8 bits pour représenter 128 ou 256 caractères possibles.

Les caractères du code ASCII sont représentés par un codage binaire 7 bits ou 8 bits dans les ordinateurs et sont stockés dans un octet, c'est-à-dire qu'un code ASCII occupe un octet.

Combien doctets un caractère ascii occupe-t-il ?

Le code ASCII peut être divisé en code ASCII standard et code ASCII étendu.

Le code ASCII standard est également appelé code ASCII de base, qui utilise 7 chiffres binaires (le chiffre binaire restant est 0) pour représenter toutes les lettres majuscules et minuscules, les chiffres de 0 à 9 et les signes de ponctuation. , ainsi que les caractères de contrôle spéciaux utilisés en anglais américain. Parmi eux : 标准ASCII码也叫基础ASCII码,使用7位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0到9、标点符号,以及在美式英语中使用的特殊控制字符。其中:

  • 0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符)

    如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;

    通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;

    ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。

  • 32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。

  • 65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。

同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。

后128个称为扩展ASCII码。

  • 0~31 et 127 (33 au total) sont des caractères de contrôle ou des caractères spécifiques à la communication (le reste sont des caractères affichables)

    tels que les caractères de contrôle : LF (saut de ligne), CR (retour chariot), FF (saut de page), DEL (suppression), BS (retour arrière), BEL (cloche), etc.

    Caractères spéciaux pour la communication : SOH ( en-tête), EOT (Fin de texte), ACK (confirmation), etc. ;
  • 32~126 (95 au total) sont des caractères (32 est un espace), dont 48~57 sont dix chiffres arabes de 0 à 9.
  • Tableau ASCII DécHex0000 00000000000 00010110100 01 01890x590101 101001 32 90
    Les valeurs ASCII 8, 9, 10 et 13 sont respectivement converties en caractères de retour arrière, de tabulation, de saut de ligne et de retour chariot. Ils n'ont pas d'affichage graphique spécifique, mais auront des effets différents sur l'affichage du texte selon l'application.
    65~90 sont 26 lettres anglaises majuscules, 97~122 sont 26 lettres anglaises minuscules, et le reste est constitué de signes de ponctuation, de symboles arithmétiques, etc.
    Notez également qu'en ASCII standard, son bit le plus élevé (b7) est utilisé comme bit de parité. Le contrôle de parité fait référence à une méthode utilisée pour vérifier si des erreurs se produisent lors de la transmission du code. Il est généralement divisé en deux types : le contrôle impair et le contrôle pair. Règles de parité impaire : le nombre de 1 dans un octet du code correct doit être un nombre impair. Si ce n'est pas un nombre impair, ajoutez 1 au bit pair le plus élevé. Règles de parité : le nombre de 1 dans un octet du code correct. le code correct doit être un nombre pair, si ce n'est pas un nombre pair, ajoutez 1 au bit le plus élevé b7.
    Les 128 derniers caractères de sont appelés codes ASCII étendus. De nombreux systèmes basés sur x86 prennent en charge l'utilisation de l'ASCII étendu (ou « élevé »). L'ASCII étendu permet d'utiliser le 8ème bit de chaque caractère pour déterminer 128 caractères de symboles spéciaux supplémentaires, des lettres étrangères et des symboles graphiques.
    Le tableau standard des codes ASCII est le suivant
    Bin
    (binaire)
    Oct
    (octal)
    (décimal)
    (Hex)
    Abréviation/Caractère
    Explication
    0x00
    NUL (nul)
    caractère nul
    0x01
    SOH(début du titre)
    🎜🎜🎜Début du titre🎜 🎜🎜🎜🎜 🎜0000 0010🎜🎜🎜🎜02🎜
    2
    0x02
    STX (début du texte)
    Début du texte
    0000 0011
    03
    3
    0x03
    ETX (fin du texte)
    Fin du texte
    0000 0100
    04
    4
    0x04
    EOT (fin de transmission)
    Fin de transmission
    0000 0101
    05
    5
    0x05
    ENQ (demande)
    Demande
    0000 0110
    06
    6
    0x06
    ACK (accuser réception)
    Recevoir une notification
    000 0 00111
    07
    7
    0x07
    BEL (cloche)
    Bell
    0000 1000
    010
    8
    0x08
    BS (retour arrière)
    Retour Grille
    0000 1001
    011
    9
    0x09
    HT (onglet horizontal)
    Onglet horizontal
    0000 1010
    012
    10
    0x0A
    LF (NL saut de ligne, nouvelle ligne)
    Saut de ligne
    0 1011
    013
    11
    0x0B
    VT (onglet vertical)
    onglet vertical
    0000 1100
    014
    12
    0x0C
    FF (NP fil de formulaire, nouvelle page)
    Clé de page
    0000 1101
    015
    13
    0x0D
    CR (retour chariot)
    Entrée clé
    000 0 1110
    016
    14
    0x0E
    SO (déplacement)
    Pas besoin de changer
    0000 1111
    017
    1 5 ​​
    0x0F
    SI (changer)
    Activer la commutation
    0001 0000
    020
    16
    0x10
    DLE (évasion de liaison de données)
    évasion de liaison de données
    0001 0001
    021
    17
    0x11
    DC1 (contrôle de l'appareil 1)
    Contrôle de l'appareil 1
    0001 0010
    022
    18
    0x12
    DC2 (contrôle de l'appareil 2)
    Contrôle de l'appareil 2
    00 01 0011
    023
    19
    0x13
    DC3 (contrôle de l'appareil 3)
    Contrôle de l'appareil 3
    0001 0100
    024
    20
    0x14
    DC4 (appareil contrôle 4)
    Contrôle de l'appareil 4
    0001 0101
    025
    21
    0x15
    NAK (accusé de réception négatif)
    Rejeter la réception
    0001 0110
    026
    22
    0x16
    SYN (ralenti synchrone)
    ralenti synchrone
    0001 0111
    027
    23
    0x17
    ETB (fin du bloc trans.)
    Fin du bloc de transfert
    0001 1000
    030
    24
    0x18
    C AN (annuler)
    Annuler
    0001 1001
    031
    25
    0x19
    EM (fin du médium)
    Fin du médium
    0 001 1010
    032
    26
    0x1A
    SUB (substitut)
    au lieu de
    0001 1011
    033
    27
    0x1B
    ESC ( évasion)
    Évasion (débordement)
    0001 1100
    034
    28
    0x1C
    FS (séparateur de fichiers)
    Séparateur de fichiers
    0001 1101
    035
    29
    0x1D
    GS (séparateur de groupe)
    Symbole de groupe
    0001 1110
    036
    30
    0x1E
    RS (séparateur d'enregistrement)
    séparateur d'enregistrement
    0001 1111
    037
    31
    0x1F
    US (séparateur d'unité)
    Séparateur d'unité
    0000
    040
    32
    0x2 0
    (espace)
    espace
    0010 0001
    041
    33
    0x21
    !
    Point d'exclamation
    0010 0010
    042
    34
    0x22
    "
    guillemets doubles
    0010 0011
    043
    35
    0x23
    #
    hashtag
    0010 0100
    044
    36
    0x24
    $
    signe dollar
    0010 0101
    045
    37
    0x25
    %
    Signe pour cent
    0010 0110
    046
    38
    0x26
    &
    Et#
    0010 0111
    047
    39
    0x27
    '
    Fermer les guillemets simples
    0010 1000
    050
    40
    0x28
    (
    support ouvert
    0010 1001
    051
    41
    0x29
    )
    Parenthèse de fermeture
    0010 1010
    052
    42
    0x2A
    *
    Étoile
    0010 1011
    053
    43
    0x2B
    +
    plus
    0010 1100
    054
    44
    0x2C
    ,
    Virgule
    0010 1101
    055
    45
    0x2D
    -
    Moins / Tiret
    0010 1110
    056
    46
    0x2E
    .
    Période
    0010 1111
    057
    47
    0x2F
    /
    slash
    0011 0000
    060
    48
    0x30
    0
    Personnage 0
    0011 0001
    061
    49
    0x31
    1
    Personnage 1
    0011 0010
    062
    50
    0x32
    2
    Caractère 2
    0011 011
    063
    51
    0x33
    3
    Personnage 3
    0011 0100
    064
    52
    0x34
    4
    Personnage 4
    0011 0101
    065
    53
    0x35
    5
    Personnage 5
    00 11 0110
    066
    54
    0x36
    6
    Personnage 6
    0011 0111
    067
    55
    0 x37
    7
    Personnage 7
    0011 1000
    070
    56
    0x38
    8
    Personnage 8
    0011 1001
    071
    57
    0x39
    9
    Personnages 9
    0011 1010
    072
    58
    0x3A
    :
    colon
    0011 1011
    073
    59
    0x3B
    ;
    point-virgule
    0011 1100
    074
    60
    0x3C
    moins que
    0011 1101
    075
    61
    0x3D
    =
    signe égal
    0011 1110
    076
    🜜
    62
    0x3E
    >
    est supérieur à
    0011 1111
    077
    63
    0x3F
    ?
    Point d'interrogation
    0100 0000
    0100
    64
    0x40
    @
    Symbole d'e-mail
    0100 0001
    0101
    65
    0x41
    A
    Capital A
    0100 0010
    0102
    66
    0x42
    B
    Capital B
    0100 0011
    0100 0100
    0105
    69
    0x45
    E
    Capital E
    0100 0110
    0106
    70
    0x 46
    F
    Capital F
    0100 0111
    0107
    71
    0x47
    G
    G majuscule
    0100 1000
    0110
    72
    0x48
    H
    Capital H
    0100 1001
    0111
    73
    0x49
    I
    lettres majuscules I
    01001010
    0112
    74
    0x4A
    J
    J majuscule
    0100 1011
    0113
    75
    0x4B
    K
    Capital K
    0100 1100
    0114
    76
    0x4C
    L
    Capital L
    0100 1101
    0115
    77
    0x4D
    M
    Capital M
    0100 1110
    0116
    78
    0x4E
    N
    Majuscule N
    0100 1111
    0117
    79
    0x4F
    O
    Capital O
    0101 0000
    01 20
    80
    0x50
    P
    Capital P
    0101 0001
    0121
    81
    0x51
    Q
    Q majuscule
    0101 0010
    0101 01 11
    0123
    83
    0x53
    S
    Capitale 101 0100
    0124
    84
    0x 54
    T
    Capital T
    0101 0101
    0125
    85
    0x55
    U
    Capitale U
    0101 0110
    0126
    86
    0x56
    V
    Capital V
    0101 0111
    0127
    87
    0x57
    W
    lettres majuscules W
    0101 1000
    0130
    88
    0x58
    X
    Lettre majuscule
    Y
    Capital Y
    0x5A
    Z
    Capital Z
    0101 1011
    0133
    91
    0x5B
    [
    Supports d'ordonnance
    0101 1100
    0134
    92
    0x5C
    Dos cils
    0101 1101
    0135
    93
    0x5D
    ]
    Crochets fermants
    0101 1110
    0136
    94
    0x5E
    ^
    Caret
    0101 1111
    0137
    95
    0x5F
    _
    sous score
    0000
    0140
    96
    0x60
    `
    guillemet simple ouvert
    0110 0001
    0141
    97
    0x61
    a
    inférieur cas a
    0110 0010
    0142
    98
    0x62
    b
    minuscule b
    0110 0011
    0143
    99
    0x63
    c
    c minuscule
    01 10 0100
    0144
    100
    0x64
    d
    minuscule d
    0110 0101
    0145
    101
    0x65
    e
    e minuscule
    0110 0110
    0146
    102
    0 x66
    f
    minuscule f
    0110 0111
    0147
    103
    0x67
    g
    minuscule g
    0110 1000
    0150
    104
    0x68
    h
    hminuscule
    0110 1001
    0151
    105
    0x69
    i
    lettres minuscules i
    0110 1010
    0152
    106
    0x6A
    j
    minuscule j
    0110 1011
    0153
    107
    0x6B
    k
    minuscule k
    0110 1100
    0 154
    108
    0x6C
    l
    minuscule l
    0110 1101
    0155
    109
    0x6D
    m
    minuscule m
    0110 1110
    0156
    110
    0x6E
    n
    minuscule n
    0110 111
    0157
    111
    0x6F
    o
    minuscule o
    0111 0000
    0160
    112
    0 x70
    p
    minuscule p
    0111
    0161
    113
    0 x71
    q
    minuscule q
    0111 0010
    0162
    114
    0x72
    r
    minuscule r
    0111 0011
    0163
    115
    0x73
    s
    minuscule s
    0111 0100
    0164
    11 6
    0x74
    t
    lettres minuscules t
    0111 0101
    0165
    117
    0x75
    u
    minuscule u
    0111 0110
    0166
    118
    0x76
    v
    minuscule v
    0111
    0 167
    119
    0x77
    w
    minuscule w
    0111 1000
    0170
    120
    0x78
    x
    minuscule x
    0111 1001
    0171
    121
    0x79
    y
    minuscule y
    0 111 1 010
    0172
    122
    0x7A
    z
    minuscule z
    0111 1011
    0173
    123
    0x7B
    {
    parenthèses d'ouverture
    0111 1100
    0174
    124
    0 x 7C
    |
    ligne verticale
    0111 1101
    0175
    125
    0x7D
    }
    Fermeture d'accolades
    0111 1110
    0176
    126
    0x7E
    ~
    tilde
    0111 1111
    0177
    127
    0x7F
    DEL (supprimer)
    supprimer

    Règles de taille

    Règles de taille pour les codes ASCII courants : chiffres

    • Les chiffres sont plus petits que les lettres. Par exemple, "7"

    • Le chiffre 0 est plus petit que le chiffre 9 et augmente dans l'ordre de 0 à 9. Par exemple, "3"

    • La lettre A est plus petite que la lettre Z et augmente dans l'ordre de A à Z. Par exemple, "A"

    • Les lettres majuscules de la même lettre sont 32 fois plus petites que les lettres minuscules. Tel que "A"

    La taille du code ASCII de plusieurs lettres courantes : "A" est 65 ; "a" est 97 ; "0" est 48.

    Pour plus de connaissances connexes, veuillez visiter la rubrique FAQ !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Article précédent:D’où est né Internet ?Article suivant:D’où est né Internet ?