Maison >Problème commun >Combien d'octets un code ascii occupe-t-il ?

Combien d'octets un code ascii occupe-t-il ?

百草
百草original
2023-09-07 16:03:256096parcourir

Un code ASCII occupe un octet. Le code ASCII est une norme de codage utilisée pour représenter des caractères. Il utilise des nombres binaires de 7 bits pour représenter 128 caractères différents, notamment des lettres, des chiffres, des signes de ponctuation, des caractères spéciaux, etc. Un octet est l'unité de base de l'unité de stockage informatique. Il se compose de 8 bits binaires. Chaque bit binaire peut être 0 ou 1. Un octet peut représenter 256 valeurs différentes, il peut donc représenter tous les caractères du code ASCII.

Combien d'octets un code ascii occupe-t-il ?

Le système d'exploitation de ce tutoriel : système Windows 10, ordinateur DELL G3.

Le code ASCII (American Standard Code for Information Interchange) est une norme de codage utilisée pour représenter des caractères. Il utilise des nombres binaires de 7 bits pour représenter 128 caractères différents, notamment des lettres, des chiffres, des signes de ponctuation, des caractères spéciaux, etc. Sur les ordinateurs, les codes ASCII sont généralement représentés par des nombres binaires de 8 bits, c'est-à-dire qu'un code ASCII occupe un octet (8 bits) d'espace de stockage.

Les caractères du code ASCII sont représentés par un codage binaire 7 bits ou 8 bits dans l'ordinateur et sont stockés dans un octet, c'est-à-dire qu'un code ASCII occupe un octet.

Un octet (Byte) est l'unité de base de l'unité de stockage informatique. Il se compose de 8 bits binaires, chaque bit binaire peut être 0 ou 1. Un octet peut représenter 256 (2 ^ 8) valeurs différentes, il peut donc représenter tous les caractères du code ASCII.

Il est à noter qu'avec le développement de la technologie informatique et la demande d'internationalisation, les codes ASCII ont progressivement été remplacés par des standards de codage plus universels comme l'Unicode. Unicode utilise 16 ou 32 bits pour représenter les caractères et peut représenter davantage de jeux de caractères, notamment des caractères et des symboles dans différentes langues.

Lors de l'utilisation du codage Unicode, un caractère peut occuper plusieurs octets d'espace de stockage. Le nombre spécifique d'octets occupés dépend du schéma de codage Unicode utilisé, tel que UTF-8, UTF-16 ou UTF-32, etc. UTF-8 est un schéma de codage Unicode courant qui utilise un codage à longueur variable. La longueur de codage d'un caractère peut aller de 1 à 4 octets.

Pour résumer, un code ASCII occupe généralement un octet (8 bits) d'espace de stockage. Cependant, avec l'application généralisée du codage Unicode, un caractère peut occuper plusieurs octets d'espace de stockage. Le nombre spécifique d'octets occupés dépend du schéma de codage Unicode utilisé.

Combien doctets un code ascii occupe-t-il ?

Le code ASCII peut être divisé en code ASCII standard et code ASCII étendu.

Le code ASCII standard est également appelé code ASCII de base. Il utilise 7 chiffres binaires (le chiffre binaire restant est 0) pour représenter toutes les lettres majuscules et minuscules, les chiffres de 0 à 9, les signes de ponctuation et les caractères utilisés en anglais américain. Caractères de contrôle spéciaux. Parmi eux :

  • 0~31 et 127 (33 au total) sont des caractères de contrôle ou des caractères spécifiques à la communication (les autres sont des caractères affichables)

    tels que des caractères de contrôle : LF (saut de ligne), CR (retour chariot) , FF (page de retour), DEL (suppression), BS (retour arrière), BEL (sonnerie), etc.

    Caractères spéciaux pour la communication : SOH (tête de texte), EOT (fin de texte), ACK (confirmation ), etc. ;

    La valeur ASCII est 8, 9, 10 et 13 sont respectivement converties en caractères de retour arrière, de tabulation, de saut de ligne et de retour chariot. Ils n'ont pas d'affichage graphique spécifique, mais auront des effets différents sur l'affichage du texte selon l'application.

  • 32~126 (95 au total) sont des caractères (32 est un espace), dont 48~57 sont dix chiffres arabes de 0 à 9.

  • 65~90 sont 26 lettres anglaises majuscules, 97~122 sont 26 lettres anglaises minuscules, et le reste est constitué de signes de ponctuation, de symboles arithmétiques, etc.

A noter également qu'en ASCII standard, son bit le plus élevé (b7) est utilisé comme bit de parité. Le contrôle de parité fait référence à une méthode utilisée pour vérifier si des erreurs se produisent lors de la transmission du code. Il est généralement divisé en deux types : le contrôle impair et le contrôle pair. Règles de parité impaire : le nombre de 1 dans un octet du code correct doit être un nombre impair. Si ce n'est pas un nombre impair, ajoutez 1 au bit pair le plus élevé. Règles de parité : le nombre de 1 dans un octet du code correct. le code correct doit être un nombre pair, si ce n'est pas un nombre pair, ajoutez 1 au bit le plus élevé b7.

Les 128 derniers sont appelés codes ASCII étendus. De nombreux systèmes x86 prennent en charge l'utilisation de l'ASCII étendu (ou « élevé »). L'ASCII étendu permet d'utiliser le 8ème bit de chaque caractère pour déterminer 128 caractères de symboles spéciaux supplémentaires, des lettres étrangères et des symboles graphiques.

Le tableau standard du code ASCII est le suivant

Guillemets simples de fermeture(parenthèse ouverte0010 1001 051410x29)Parenthèse de fermeture 001 0 10100520131
Tableau ASCII
Bin
(binaire)
Oct
(octal)
Déc
(décimal)
Hex
(hex)
Abréviation/Caractère
Explication
0000 0000
00
0
0x00
NUL(null)
caractère nul
0000 0001
01
1
0x01
SOH(début du titre)
Début du titre
0000 0010
02
2
0x02
STX (début du texte)
Le texte commence
0000 0011
03
3
0x03
ETX (fin du texte)
Fin du texte
0000 0100
04
4
0x04
EOT (fin de transmission)
Fin de transmission
0000 0101
05
5
0x05
ENQ (demande)
Demande
0000 0110
06
6
0x06
ACK (accuser réception)
Recevoir une notification
0000 0111
07
7
0x07
BEL (cloche)
Cloche
0000 1000
010
8
0x08
BS (retour arrière)
Retour arrière
0000 1001
0 11
9
0x09
HT (onglet horizontal)
Onglet horizontal
0000 1010
012
10
0x0A
LF (saut de ligne NL, nouvelle ligne)
Touche de saut de ligne
0000 1011
013
11
0x0B
VT (onglet vertical)
V onglet vertical
0000 1100
014
12
0x0C
FF (flux de formulaire NP, nouvelle page)
Clé de page
0000 1101
015
13
0x0D
CR (retour chariot)
Touche Entrée
0000 1110
016
14
0x0E
SO (déplacement)
Pas besoin de changer
0000 1111
0001 000
020
16
0x10
DLE (évasion de liaison de données)
Évasion de liaison de données
0001 0001
021
17
0x11
DC1 (contrôle de l'appareil 1)
Contrôle de l'appareil 1
0001 0010
0 22
18
0x12
DC2 (contrôle de l'appareil 2)
Contrôle de l'appareil 2
0001 0011
023
19
0x 13
DC3 (contrôle de l'appareil 3)
Contrôle de l'appareil 3
0001 0100
024
20
0x14
DC4 (contrôle de l'appareil 4)
Contrôle de l'appareil 4
0001 0101
025
21
0x15
NAK (accusé de réception négatif)
Rejeté
0001 0110
026
22
0x16
SYN (synchrone inactif)
Sync inactif
0001 0111
027
23
0x17
ETB (fin du bloc trans.)
Fin du bloc trans
0001 1000
030
24
0x18
CAN (annuler)
Annuler
0001
031
25
0x19
EM ( fin de médium)
Fin de médium
0001 1010
032
26
0x1A
SUB (remplacement)
Au lieu de
0001 1011
033
27
0x1B
ESC (évasion)
Échap (débordement)
0001 1100
034
28
0x1C
FS (séparateur de fichiers)
Séparateur de fichiers
0001 1101
035
29
0x 1D
GS (séparateur de groupe)
Symbole de regroupement
0001 1110
036
30
0x1E
RS (séparateur d'enregistrement)
Séparateur d'enregistrement
0001 1111
037
31
0x1F
US (séparateur d'unité)
Séparateur d'unité
0010 0000
040
32
0x20
(espace)
espace
0010 0001
041
33
0x21
!
Point d'exclamation
0010 0010
042
34
0x22
"
guillemets doubles
0010 0011
043
35
0x23
#
Hashtag
0010 0100
044
36
0x24
$
Signe du dollar
0010 0101
045
37
0x25
%
Signe de pourcentage
0010 0110
0010 0111
047
39
0x27
'
0010 1000
050
40
0x28
42
0x2A
*
star
0010 1011
053
43
0x2B
+
Plus
0010 1100
054
44
0x2C
,
virgule
0010 1101
055
45
0x2D
-
Moins/tiret
0010 1110
056
46
0x2E
.
Période
0010 1111
057
47
0x2F
/
0000
060
48
0x30
0
Personnage 0
0011 0001
061
49
0x31
1
Personnage 1
0011 0010
062
50
0x32
2
Personnage 2
0011 0011
063
51
0x33
3
Personnage 3
0011 0100
064
52
0x34
4
Caractère 4
0011 0101
065
53
0x35
5
Caractère 5
0011 0110
0 66
54
0x36
6
Personnage 6
0011 0111
067
55
0x37
7
Personnage 7
0011 1000
070
56
0x38
8
Caractère 8
0011 1001
071
57
0x39
9
Personnage 9
0011 1010
072
58
0x3A
 :
Côlon
0011 1011
073
59
0x3B
;
point-virgule
0011 1100
074
60
0x3C
moins de
0011 1101
075
61
0x3D
=
Signe égal
0011 1110
076
62
0x3E
>
est supérieur à
0011 1111
077
63
0x3F
?
Point d'interrogation
010 0 0000
0100
64
0x40
@
Symbole d'e-mail
0001
010 1
65
0x41
A
Capital A
0100 0010
0102
66
0x42
B
Capital B
0100 0011
0100 01 00
0104
68
0x44
D
Capital D
010 0 0101
0105
69
0x 45
E
Capital E
0100 0110
0106
70
0x46
F
Capital F
0100 0111
0107
71
0x47
G
G majuscule
0100 10 00
0110
72
0x48
H
Capital H
0100 1001
0111
73
0x 49
I
Lettre majuscule I
01001010
0112
74
0x4A
J
Capital J
0100 1011
0113
75
0x4B
K
K majuscule
0100 1100
01 14
76
0x4C
L
Capital L
0100 1101
0115
77
0x4D
M
M majuscule
0100 1110
0116
78
0x4E
N
Capital N
0100 11 11
0117
79
0x4F
O
Capital O
0101 0000
0120
80
0x 50
P
Capital P
0101 0001
0121
81
0x51
Q
Q majuscule
0101 0010
0101 01 11
0123
83
0x53
S
Capitale 101 0100
0124
84
0x 54
T
Capital T
0101 0101
0125
85
0x55
U
Capitale U
0101 0110
0126
86
0x56
V
Capital V
0101 0111
01 27
87
0x57
W
Capital W
0101 1000
0130
88
0x58
X
Lettre majuscule
89
90
0x5A
Z
Capital Z
0101 1011
0133
91
0x 5B
[
Crochets ouverts
0101 1100
0134
92
0x5C
backslash
0101 1101
0135
93
0x5D
]
Crochets fermants
0101 1110
0136
94
0x5E
^
caret
0101 1111
0137
95
0x5F
_
underscore
0110 0000
0140
96
0x60
`
guillemet simple ouvert
01 10 0001
0141
97
0x61
a
minuscule a
0110
01 42
98
0x62
b
minuscule b
0110 0011
0143
99
0x63
c
minuscule c
0110 0100
0110 0 101
0145
101
0x65
e
minuscule e
0110 0110
0146
102
0x66
f
minuscule f
0110 0111
0147
103
0x67
g
minuscule g
0110 1000
0150
104
0x68
h
hminuscule
0110 001
0151
105
0x69
i
minuscule i
0110 1010
0152
106
0 x6A
j
minuscule j
0110 1011
0153
107
0x6B
k
minuscule k
0110 1100
0154
108
0x6C
l
minuscule l
0110 1101
0 155
109
0x6D
m
minuscule m
0110 1110
0156
110
0x6E
n
minuscule n
0110 1111
0111 0 000
0160
112
0x70
p
minuscule p
0111 0001
0161
113
0x71
q
minuscule q
0111 0010
0162
114
0x72
r
minuscule r
0111 0011
0111 0 100
0164
116
0x74
t
minuscule t
0111 0101
0165
117
0 x75
u
minuscule u
0111 0110
0166
118
0x76
v
v minuscule
0111 0111
0167
119
0x77
w
minuscule w
0111 1000
0 170
120
0x78
x
minuscule
y
minuscule y
0111 1010
0172
122
0x7A
z
z minuscule
0111 1 011
0173
123
0x7B
{
parenthèses d'ouverture
0111 1100
0174
124
0x 7C
|
Ligne verticale
0111 1101
0175
125
0x7D
}
Orthèse de fermeture
0111 1110
0176
126
0x7E
~
tilde
0111 1111
0177
127
0x7F
DEL (supprimer)
Supprimer

Règles de taille

Règles courantes de taille du code ASCII : chiffres

  • Les chiffres sont plus petits que les lettres. Par exemple, "7"

  • Le chiffre 0 est plus petit que le chiffre 9 et augmente dans l'ordre de 0 à 9. Par exemple, "3"

  • La lettre A est plus petite que la lettre Z et augmente dans l'ordre de A à Z. Par exemple, "A"

  • Les lettres majuscules de la même lettre sont 32 fois plus petites que les lettres minuscules. Tel que "A"

La taille du code ASCII de plusieurs lettres courantes : "A" est 65 ; "a" est 97 ; "0" est 48.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn