Maison >Problème commun >Combien d'octets un code ascii occupe-t-il ?
Un code ASCII occupe un octet. Le code ASCII est une norme de codage utilisée pour représenter des caractères. Il utilise des nombres binaires de 7 bits pour représenter 128 caractères différents, notamment des lettres, des chiffres, des signes de ponctuation, des caractères spéciaux, etc. Un octet est l'unité de base de l'unité de stockage informatique. Il se compose de 8 bits binaires. Chaque bit binaire peut être 0 ou 1. Un octet peut représenter 256 valeurs différentes, il peut donc représenter tous les caractères du code ASCII.
Le système d'exploitation de ce tutoriel : système Windows 10, ordinateur DELL G3.
Le code ASCII (American Standard Code for Information Interchange) est une norme de codage utilisée pour représenter des caractères. Il utilise des nombres binaires de 7 bits pour représenter 128 caractères différents, notamment des lettres, des chiffres, des signes de ponctuation, des caractères spéciaux, etc. Sur les ordinateurs, les codes ASCII sont généralement représentés par des nombres binaires de 8 bits, c'est-à-dire qu'un code ASCII occupe un octet (8 bits) d'espace de stockage.
Les caractères du code ASCII sont représentés par un codage binaire 7 bits ou 8 bits dans l'ordinateur et sont stockés dans un octet, c'est-à-dire qu'un code ASCII occupe un octet.
Un octet (Byte) est l'unité de base de l'unité de stockage informatique. Il se compose de 8 bits binaires, chaque bit binaire peut être 0 ou 1. Un octet peut représenter 256 (2 ^ 8) valeurs différentes, il peut donc représenter tous les caractères du code ASCII.
Il est à noter qu'avec le développement de la technologie informatique et la demande d'internationalisation, les codes ASCII ont progressivement été remplacés par des standards de codage plus universels comme l'Unicode. Unicode utilise 16 ou 32 bits pour représenter les caractères et peut représenter davantage de jeux de caractères, notamment des caractères et des symboles dans différentes langues.
Lors de l'utilisation du codage Unicode, un caractère peut occuper plusieurs octets d'espace de stockage. Le nombre spécifique d'octets occupés dépend du schéma de codage Unicode utilisé, tel que UTF-8, UTF-16 ou UTF-32, etc. UTF-8 est un schéma de codage Unicode courant qui utilise un codage à longueur variable. La longueur de codage d'un caractère peut aller de 1 à 4 octets.
Pour résumer, un code ASCII occupe généralement un octet (8 bits) d'espace de stockage. Cependant, avec l'application généralisée du codage Unicode, un caractère peut occuper plusieurs octets d'espace de stockage. Le nombre spécifique d'octets occupés dépend du schéma de codage Unicode utilisé.
Le code ASCII peut être divisé en code ASCII standard et code ASCII étendu.
Le code ASCII standard est également appelé code ASCII de base. Il utilise 7 chiffres binaires (le chiffre binaire restant est 0) pour représenter toutes les lettres majuscules et minuscules, les chiffres de 0 à 9, les signes de ponctuation et les caractères utilisés en anglais américain. Caractères de contrôle spéciaux. Parmi eux :
0~31 et 127 (33 au total) sont des caractères de contrôle ou des caractères spécifiques à la communication (les autres sont des caractères affichables)
tels que des caractères de contrôle : LF (saut de ligne), CR (retour chariot) , FF (page de retour), DEL (suppression), BS (retour arrière), BEL (sonnerie), etc.
Caractères spéciaux pour la communication : SOH (tête de texte), EOT (fin de texte), ACK (confirmation ), etc. ;
La valeur ASCII est 8, 9, 10 et 13 sont respectivement converties en caractères de retour arrière, de tabulation, de saut de ligne et de retour chariot. Ils n'ont pas d'affichage graphique spécifique, mais auront des effets différents sur l'affichage du texte selon l'application.
32~126 (95 au total) sont des caractères (32 est un espace), dont 48~57 sont dix chiffres arabes de 0 à 9.
65~90 sont 26 lettres anglaises majuscules, 97~122 sont 26 lettres anglaises minuscules, et le reste est constitué de signes de ponctuation, de symboles arithmétiques, etc.
A noter également qu'en ASCII standard, son bit le plus élevé (b7) est utilisé comme bit de parité. Le contrôle de parité fait référence à une méthode utilisée pour vérifier si des erreurs se produisent lors de la transmission du code. Il est généralement divisé en deux types : le contrôle impair et le contrôle pair. Règles de parité impaire : le nombre de 1 dans un octet du code correct doit être un nombre impair. Si ce n'est pas un nombre impair, ajoutez 1 au bit pair le plus élevé. Règles de parité : le nombre de 1 dans un octet du code correct. le code correct doit être un nombre pair, si ce n'est pas un nombre pair, ajoutez 1 au bit le plus élevé b7.
Les 128 derniers sont appelés codes ASCII étendus. De nombreux systèmes x86 prennent en charge l'utilisation de l'ASCII étendu (ou « élevé »). L'ASCII étendu permet d'utiliser le 8ème bit de chaque caractère pour déterminer 128 caractères de symboles spéciaux supplémentaires, des lettres étrangères et des symboles graphiques.
Le tableau standard du code ASCII est le suivant
Bin
(binaire)
|
Oct
(octal)
|
Déc
(décimal)
|
Hex
(hex)
|
Abréviation/Caractère | Explication
|
||||
0000 0000 |
00 |
0 |
0x00 |
NUL(null) |
caractère nul |
||||
0000 0001 |
01 |
1 |
0x01 |
SOH(début du titre) |
Début du titre |
||||
0000 0010 |
02 |
2 |
0x02 |
STX (début du texte) |
Le texte commence |
||||
0000 0011 |
03 |
3 |
0x03 |
ETX (fin du texte)
|
Fin du texte | ||||
0000 0100 |
04 |
4 |
0x04 |
EOT (fin de transmission) |
Fin de transmission |
||||
0000 0101 |
05
|
5 |
0x05 | ENQ (demande) |
Demande |
||||
0000 0110 |
06 |
6 |
0x06 |
ACK (accuser réception) |
Recevoir une notification |
||||
0000 0111 |
07 |
7 |
0x07 |
BEL (cloche) |
Cloche |
||||
0000 1000 |
010 | 8 |
0x08 |
BS (retour arrière) |
Retour arrière |
||||
0000 1001 |
0 11 |
9 |
0x09 |
HT (onglet horizontal) |
Onglet horizontal |
||||
0000 1010 |
012 |
10 |
0x0A |
LF (saut de ligne NL, nouvelle ligne)
|
Touche de saut de ligne | ||||
0000 1011 |
013 |
11 |
0x0B |
VT (onglet vertical) |
V onglet vertical
|
||||
0000 1100 |
014 |
12 |
0x0C |
FF (flux de formulaire NP, nouvelle page) |
Clé de page |
||||
0000 1101 | 015 |
13 |
0x0D |
CR (retour chariot) |
Touche Entrée |
||||
0000 1110 |
016 |
14 |
0x0E |
SO (déplacement) | Pas besoin de changer |
||||
0000 1111 0001 000 |
020 | 16 |
|
DLE (évasion de liaison de données) | Évasion de liaison de données | ||||
0001 0001 | 021 |
|
0x11 | DC1 (contrôle de l'appareil 1) | Contrôle de l'appareil 1 | ||||
0001 0010 | 0 22 | 18 | 0x12 | |
Contrôle de l'appareil 2 | ||||
0001 0011 | 023 | 19 | 0x 13 | DC3 (contrôle de l'appareil 3) |
|
||||
0001 0100 | 024 | 20 | 0x14 | DC4 (contrôle de l'appareil 4) |
Contrôle de l'appareil 4 |
||||
0001 0101 |
025 |
21 | 0x15
|
NAK (accusé de réception négatif) | Rejeté |
||||
0001 0110 |
026 |
22 |
0x16 |
SYN (synchrone inactif) |
Sync inactif |
||||
0001 0111 |
027 |
23 |
0x17 |
ETB (fin du bloc trans.) |
Fin du bloc trans |
||||
0001 1000
|
030 | 24
|
0x18 |
CAN (annuler) |
Annuler |
||||
0001 |
031 |
25 |
0x19 |
EM ( fin de médium) |
Fin de médium |
||||
0001 1010 |
032 |
26 |
0x1A |
SUB (remplacement) |
Au lieu de
|
||||
0001 1011 |
033 | 27 |
0x1B |
ESC (évasion) |
Échap (débordement) |
||||
0001 1100 | 034 |
28 |
0x1C | FS (séparateur de fichiers) |
Séparateur de fichiers |
||||
0001 1101 |
035 |
29 |
0x 1D |
GS (séparateur de groupe) |
Symbole de regroupement |
||||
0001 1110 |
036 |
30 |
0x1E |
RS (séparateur d'enregistrement) |
Séparateur d'enregistrement |
||||
0001 1111 | 037 |
31 |
0x1F |
US (séparateur d'unité) |
Séparateur d'unité |
||||
0010 0000 | 040
|
32 |
0x20 | (espace)
|
espace |
||||
0010 0001 |
041 |
33 |
0x21 |
! |
Point d'exclamation |
||||
0010 0010 |
042 |
34 |
0x22 |
" |
guillemets doubles |
||||
0010 0011 |
043 |
35 |
0x23 |
# |
Hashtag |
||||
0010 0100 |
044 |
36 |
0x24 |
$ |
Signe du dollar |
||||
0010 0101 |
045 |
37 |
0x25 |
% |
Signe de pourcentage |
||||
0010 0110 | 0010 0111 |
047 | 39 | 0x27 | ' | ||||
0010 1000 | 050 | 40 | 0x28 | (parenthèse ouverte | |||||
0010 1001 | 051 | 41 | 0x29 | ) | Parenthèse de fermeture | ||||
001 0 1010 | 052 | 42 |
0x2A |
* |
star |
||||
0010 1011 |
053 |
43 |
0x2B |
+ | Plus
|
||||
0010 1100 |
054 |
44 |
0x2C |
, | virgule |
||||
0010 1101 |
055 | 45 |
0x2D |
- |
Moins/tiret |
||||
0010 1110 |
056
|
46 |
0x2E |
. | Période |
||||
0010 1111 |
057 |
47 |
0x2F |
/ 0000 |
060 | ||||
48 | 0x30 | 0 | Personnage 0 | 0011 0001 |
|
||||
49 | 0x31 | 1 | Personnage 1 | 0011 0010 | 062 | ||||
50 | 0x32 | 2 | Personnage 2 | 0011 0011 | 063 | ||||
51 | 0x33 | 3 | Personnage 3 | 0011 0100 | 064 | ||||
52 | 0x34 | 4 | Caractère 4 | 0011 0101 | 065 | 53 |
0x35 |
5 |
Caractère 5 |
0011 0110 |
0 66 |
54 |
0x36 |
6 | Personnage 6 |
||||
0011 0111 |
067 |
55 |
0x37 |
7 |
Personnage 7 |
||||
0011 1000 |
070 |
56 |
0x38 |
8 |
Caractère 8 |
||||
0011 1001 | 071
|
57 |
0x39 |
9 |
Personnage 9 |
||||
0011 1010 |
072 |
58 |
0x3A | :
|
Côlon |
||||
0011 1011 |
073 |
59 |
0x3B |
; |
point-virgule |
||||
0011 1100 |
074 |
60 |
0x3C |
moins de |
|||||
0011 1101 |
075
|
61 |
0x3D |
= |
Signe égal |
||||
0011 1110 |
076 |
62 |
0x3E |
>
|
est supérieur à |
||||
0011 1111 | 077 |
63 |
0x3F |
? |
Point d'interrogation |
||||
010 0 0000 |
0100 |
64 |
0x40 |
@ |
Symbole d'e-mail |
||||
0001 |
010 1 |
65 |
0x41 |
A | Capital A |
||||
0100 0010 |
0102 |
66 |
0x42 |
B
|
Capital B |
||||
0100 0011 0100 01 00 |
0104 | 68 | 0x44 | D | Capital D | ||||
010 0 0101 | 0105 | 69 | 0x 45 | E | Capital E |
||||
0100 0110 |
0106 |
70 |
0x46 |
F
|
Capital F |
||||
0100 0111 |
0107
|
71 |
0x47 |
G |
G majuscule |
||||
0100 10 00 |
0110 |
72 |
0x48 |
H
|
Capital H |
||||
0100 1001 |
0111 |
73 |
0x 49 |
I |
Lettre majuscule I |
||||
01001010 |
0112 |
74 |
0x4A |
J |
Capital J | ||||
0100 1011 |
0113 |
75 |
0x4B |
K |
K majuscule |
||||
0100 1100 |
01 14 |
76 |
0x4C |
L |
Capital L |
||||
0100 1101 |
0115 |
77 |
0x4D |
M
|
M majuscule |
||||
0100 1110 |
0116
|
78 |
0x4E |
N |
Capital N |
||||
0100 11 11 |
0117 |
79 |
0x4F |
O
|
Capital O |
||||
0101 0000 |
0120 |
80 |
0x 50 |
P |
Capital P |
||||
0101 0001 |
0121 |
81 |
0x51 |
Q
|
Q majuscule |
||||
0101 0010 0101 01 11 |
0123 | 83 | 0x53 | S | Capitale 101 0100 | ||||
0124 | 84 | 0x 54 | T | Capital T | 0101 0101 | ||||
0125 | 85 | 0x55 | U | Capitale U | 0101 0110 | ||||
0126 | 86 |
0x56 |
V |
Capital V |
|||||
0101 0111 |
01 27 |
87 |
0x57 |
W |
Capital W |
||||
0101 1000 |
0130 |
88 |
0x58 |
X
|
Lettre majuscule |
||||
89 | 90 | 0x5A |
Z | Capital Z |
0101 1011 | ||||
0133 | 91 | 0x 5B | [ | Crochets ouverts |
|||||
0101 1100 |
0134 |
92 |
0x5C |
backslash |
|||||
0101 1101 | 0135 |
93 |
0x5D |
] |
Crochets fermants |
||||
0101 1110 |
0136 |
94 |
0x5E | ^ |
caret |
||||
0101 1111 |
0137 |
95 |
0x5F |
_
|
underscore |
||||
0110 0000 |
0140
|
96 |
0x60 |
` |
guillemet simple ouvert |
||||
01 10 0001 |
0141 |
97 |
0x61 |
a |
minuscule a |
||||
0110 |
01 42 |
98 |
0x62 |
b |
minuscule b |
||||
0110 0011 |
0143 |
99 |
0x63 |
c
|
minuscule c |
||||
0110 0100 0110 0 101 |
0145 | 101 | 0x65 | e | minuscule e | ||||
0110 0110 | 0146 | 102 | 0x66 | f | minuscule f |
||||
0110 0111 |
0147 |
103 |
0x67 |
g
|
minuscule g |
||||
0110 1000 |
0150 |
104 |
0x68 |
h |
hminuscule |
||||
0110 001 |
0151 |
105 |
0x69 |
i |
minuscule i |
||||
0110 1010 |
0152 |
106 |
0 x6A |
j |
minuscule j |
||||
0110 1011 |
0153 |
107 |
0x6B |
k |
minuscule k | ||||
0110 1100 |
0154 |
108 |
0x6C |
l |
minuscule l |
||||
0110 1101 |
0 155 |
109 |
0x6D |
m |
minuscule m |
||||
0110 1110 |
0156 |
110 |
0x6E | n
|
minuscule n |
||||
0110 1111 0111 0 000 |
0160 | 112 | 0x70 | p | minuscule p | ||||
0111 0001 | 0161 | 113 |
|
q | minuscule q |
||||
0111 0010 |
0162 |
114 |
0x72 |
r
|
minuscule r |
||||
0111 0011 0111 0 100 |
0164 | 116 | 0x74 | t | minuscule t | ||||
0111 0101 | 0165 | 117 | 0 x75 | u | minuscule u | ||||
0111 0110 | 0166 | 118 | 0x76 | v | v minuscule | ||||
0111 0111 | 0167 | 119 |
0x77 |
w |
minuscule w |
||||
0111 1000 |
0 170 |
120 |
0x78 |
x |
minuscule y |
||||
minuscule y | 0111 1010 | 0172 | 122 | 0x7A | z | ||||
z minuscule | 0111 1 011 | 0173 | 123 | 0x7B | { | ||||
parenthèses d'ouverture | 0111 1100 | 0174 | 124 | 0x 7C | | | Ligne verticale |
|||
0111 1101 |
0175 |
125 |
0x7D |
}
|
Orthèse de fermeture |
||||
0111 1110 | 0176
|
126 |
0x7E |
~ |
tilde |
||||
0111 1111 |
0177 |
127 |
0x7F |
DEL (supprimer)
|
Supprimer |
Règles de taille
Règles courantes de taille du code ASCII : chiffres
Les chiffres sont plus petits que les lettres. Par exemple, "7"
Le chiffre 0 est plus petit que le chiffre 9 et augmente dans l'ordre de 0 à 9. Par exemple, "3"
La lettre A est plus petite que la lettre Z et augmente dans l'ordre de A à Z. Par exemple, "A"
Les lettres majuscules de la même lettre sont 32 fois plus petites que les lettres minuscules. Tel que "A"
La taille du code ASCII de plusieurs lettres courantes : "A" est 65 ; "a" est 97 ; "0" est 48.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!