Maison >Problème commun >Combien d'octets un caractère ascii occupe-t-il ?
Un caractère ascii occupe 1 octet. Les caractères du code ASCII sont représentés par un codage binaire 7 bits ou 8 bits dans l'ordinateur et sont stockés dans un octet, c'est-à-dire qu'un code ASCII occupe un octet. Le code ASCII peut être divisé en code ASCII standard et code ASCII étendu. Le code ASCII standard est également appelé code ASCII de base. Il utilise des nombres binaires de 7 bits (le chiffre binaire restant est 0) pour représenter toutes les lettres majuscules et minuscules. chiffres de 0 à 9. Signes de ponctuation et caractères de contrôle spéciaux utilisés en anglais américain.
L'environnement d'exploitation de ce tutoriel : système Windows 7, ordinateur Dell G3.
ASCII (American Standard Code for Information Interchange) : L'American Standard Code for Information Interchange est un système de codage informatique basé sur l'alphabet latin, principalement utilisé pour afficher l'anglais moderne et d'autres langues d'Europe occidentale.
Le code ASCII utilise une combinaison de nombres binaires spécifiée de 7 ou 8 bits pour représenter 128 ou 256 caractères possibles.
Les caractères du code ASCII sont représentés par un codage binaire 7 bits ou 8 bits dans les ordinateurs et sont stockés dans un octet, c'est-à-dire qu'un code ASCII occupe un octet.
Le code ASCII peut être divisé en code ASCII standard et code ASCII étendu.
Le code ASCII standard est également appelé code ASCII de base
, qui utilise 7 chiffres binaires (le chiffre binaire restant est 0) pour représenter toutes les lettres majuscules et minuscules, les chiffres de 0 à 9 et les signes de ponctuation. , ainsi que les caractères de contrôle spéciaux utilisés en anglais américain. Parmi eux : 标准ASCII码也叫基础ASCII码
,使用7位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0到9、标点符号,以及在美式英语中使用的特殊控制字符。其中:
0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符)
如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;
通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;
ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。
32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。
65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。
同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。
后128个称为扩展ASCII码。
tels que les caractères de contrôle : LF (saut de ligne), CR (retour chariot), FF (saut de page), DEL (suppression), BS (retour arrière), BEL (cloche), etc.
Caractères spéciaux pour la communication : SOH ( en-tête), EOT (Fin de texte), ACK (confirmation), etc. ;65~90 sont 26 lettres anglaises majuscules, 97~122 sont 26 lettres anglaises minuscules, et le reste est constitué de signes de ponctuation, de symboles arithmétiques, etc. Notez également qu'en ASCII standard, son bit le plus élevé (b7) est utilisé comme bit de parité. Le contrôle de parité fait référence à une méthode utilisée pour vérifier si des erreurs se produisent lors de la transmission du code. Il est généralement divisé en deux types : le contrôle impair et le contrôle pair. Règles de parité impaire : le nombre de 1 dans un octet du code correct doit être un nombre impair. Si ce n'est pas un nombre impair, ajoutez 1 au bit pair le plus élevé. Règles de parité : le nombre de 1 dans un octet du code correct. le code correct doit être un nombre pair, si ce n'est pas un nombre pair, ajoutez 1 au bit le plus élevé b7. Les 128 derniers caractères de sont appelés codes ASCII étendus. De nombreux systèmes basés sur x86 prennent en charge l'utilisation de l'ASCII étendu (ou « élevé »). L'ASCII étendu permet d'utiliser le 8ème bit de chaque caractère pour déterminer 128 caractères de symboles spéciaux supplémentaires, des lettres étrangères et des symboles graphiques. |
Le tableau standard des codes ASCII est le suivant
| Tableau ASCIIBin | (binaire) Oct | (octal) | Déc(décimal) | |||
(Hex) |
Abréviation/Caractère |
Explication |
0000 0000 | 00 |
| 0|||
0x00 |
NUL (nul) |
caractère nul |
0000 0001 | 01 | 1 | |||
0x01 | SOH(début du titre) 🎜🎜🎜Début du titre🎜 🎜🎜🎜🎜 🎜0000 0010🎜🎜🎜🎜02🎜 |
2 |
0x02 |
STX (début du texte) |
Début du texte |
|||
0000 0011 |
03
|
3 |
0x03 | ETX (fin du texte) |
Fin du texte |
|||
0000 0100 |
04 |
4 |
0x04
|
EOT (fin de transmission) |
Fin de transmission
|
|||
0000 0101 |
05 |
5 |
0x05 |
ENQ (demande) |
Demande |
|||
0000 0110 |
06
|
6 |
0x06 |
ACK (accuser réception) |
Recevoir une notification |
|||
000 0 00111 |
07 |
7 |
0x07 |
BEL (cloche) |
Bell |
|||
0000 1000 |
010 |
8 | 0x08
|
BS (retour arrière) |
Retour Grille |
|||
0000 1001 |
011 |
9 |
0x09 |
HT (onglet horizontal) | Onglet horizontal |
|||
0000 1010 |
012
|
10 |
0x0A |
LF (NL saut de ligne, nouvelle ligne) |
Saut de ligne |
|||
0 1011 |
013 |
11 |
0x0B |
VT (onglet vertical) |
onglet vertical |
|||
0000 1100 |
014 | 12 |
0x0C |
FF (NP fil de formulaire, nouvelle page) |
Clé de page |
|||
0000 1101 |
015 |
13 |
0x0D |
CR (retour chariot) |
Entrée clé |
|||
000 0 1110 |
016 |
14 | 0x0E |
SO (déplacement) |
Pas besoin de changer |
|||
0000 1111 |
017 |
1 5 |
0x0F |
SI (changer) |
Activer la commutation |
|||
0001 0000 |
020 |
16 |
0x10 | DLE (évasion de liaison de données)
|
évasion de liaison de données | |||
0001 0001 |
021 |
17 |
0x11 |
DC1 (contrôle de l'appareil 1) |
Contrôle de l'appareil 1
|
|||
0001 0010 | 022 |
18 |
0x12 |
DC2 (contrôle de l'appareil 2) |
Contrôle de l'appareil 2 |
|||
00 01 0011 |
023 |
19 | 0x13 |
DC3 (contrôle de l'appareil 3) |
Contrôle de l'appareil 3 |
|||
0001 0100 |
024 |
20 |
0x14 |
DC4 (appareil contrôle 4) |
Contrôle de l'appareil 4 |
|||
0001 0101 |
025 |
21 |
0x15 |
NAK (accusé de réception négatif)
|
Rejeter la réception |
|||
0001 0110 |
026 |
22 |
0x16 |
SYN (ralenti synchrone) |
ralenti synchrone
| |||
0001 0111 |
027 |
23
|
0x17 |
ETB (fin du bloc trans.) |
Fin du bloc de transfert |
|||
0001 1000 |
030 |
24 |
0x18 |
C AN (annuler) |
Annuler |
|||
0001 1001 |
031 |
25 |
0x19 |
EM (fin du médium) |
Fin du médium |
|||
0 001 1010 |
032 |
26 |
0x1A |
SUB (substitut) |
au lieu de |
|||
0001 1011 |
033 |
27
|
0x1B |
ESC ( évasion) | Évasion (débordement) |
|||
0001 1100 |
034 |
28 |
0x1C | FS (séparateur de fichiers) |
Séparateur de fichiers | |||
0001 1101 |
035 |
29 |
0x1D |
GS (séparateur de groupe) |
Symbole de groupe |
|||
0001 1110 |
036 |
30
|
0x1E |
RS (séparateur d'enregistrement) |
séparateur d'enregistrement |
|||
0001 1111 | 037 |
31 |
0x1F |
US (séparateur d'unité)
|
Séparateur d'unité |
|||
0000 |
040 |
32 |
0x2 0 |
(espace) |
espace |
|||
0010 0001 |
041 |
33 |
0x21 |
! |
Point d'exclamation |
|||
0010 0010 |
042 |
34 | 0x22 |
" |
guillemets doubles |
|||
0010 0011 |
043 |
35 |
0x23 |
# |
hashtag |
|||
0010 0100 |
044 |
36 |
0x24 |
$ |
signe dollar |
|||
0010 0101 |
045 |
37 |
0x25 |
% |
Signe pour cent |
|||
0010 0110 |
046 |
38 |
0x26
|
& |
Et# |
|||
0010 0111
|
047 |
39 |
0x27 |
' |
Fermer les guillemets simples |
|||
0010 1000 |
050 |
40 | 0x28 |
( |
support ouvert |
|||
0010 1001 |
051 |
41 |
0x29 |
) |
Parenthèse de fermeture | |||
0010 1010 |
052 |
42 |
0x2A |
* |
Étoile |
|||
0010 1011 |
053 |
43 |
0x2B |
+ |
plus |
|||
0010 1100 |
054 | 44 |
0x2C |
, |
Virgule |
|||
0010 1101 |
055 |
45 |
0x2D |
- |
Moins / Tiret |
|||
0010 1110 |
056 |
46 |
0x2E |
.
|
Période |
|||
0010 1111 | 057
|
47 |
0x2F |
/ |
slash |
|||
0011 0000 | 060 |
48 |
0x30 |
0
|
Personnage 0 |
|||
0011 0001 |
061 |
49 |
0x31 | 1 |
Personnage 1 |
|||
0011 0010 | 062 |
50 |
0x32 |
2 |
Caractère 2 |
|||
0011 011 |
063 |
51 |
0x33 |
3
|
Personnage 3 |
|||
0011 0100 |
064 |
52 |
0x34 |
4 |
Personnage 4 |
|||
0011 0101 |
065 |
53 |
0x35 |
5 |
Personnage 5 |
|||
00 11 0110 |
066 |
54 |
0x36 |
6 |
Personnage 6 |
|||
0011 0111 |
067 |
55 |
0 x37
|
7 |
Personnage 7 |
|||
0011 1000 |
070 |
56 |
0x38 |
8 |
Personnage 8 |
|||
0011 1001 |
071 |
57 |
0x39 |
9 |
Personnages 9 |
|||
0011 1010 |
072 |
58 |
0x3A |
: |
colon |
|||
0011 1011 |
073 |
59
|
0x3B |
; |
point-virgule |
|||
0011 1100 |
074 |
60 |
0x3C |
moins que
|
||||
0011 1101 |
075 |
61
|
0x3D |
= |
signe égal |
|||
0011 1110 |
076 🜜 |
62 | 0x3E | > | est supérieur à | |||
0011 1111 | 077 | 63 | 0x3F | ? |
Point d'interrogation | |||
0100 0000 | 0100 | 64 | 0x40 | @ | Symbole d'e-mail | |||
0100 0001 | 0101 |
65 | 0x41 | A | Capital A | |||
0100 0010 | 0102 | 66 | 0x42 | B | Capital B | |||
0100 0011 0100 0100 | 0100 01 010105 | 69 | 0x45 | E | Capital E | |||
0100 0110 | 0106 | 70 |
|
F | Capital F | |||
0100 0111 | 0107 | 71 | 0x47 | G | G majuscule | |||
0100 1000 | 0110 | 72 | 0x48 | H | Capital H | |||
0100 1001 | 0111 | 73 | 0x49 | I | lettres majuscules I | |||
01001010 | 0112 |
|
0x4A | J |
|
|||
0100 1011 | 0113 | 75 | 0x4B | K |
|
|||
0100 1100 | 0114 |
|
0x4C | L | Capital L | |||
0100 1101 | 0115 | 77 | 0x4D | M | Capital M | |||
0100 1110 | 0116 | 78 | 0x4E | N |
|
|||
0100 1111 | 0117 | 79 |
0x4F |
O |
Capital O |
|||
0101 0000 |
01 20 |
80 |
0x50 |
P |
Capital P |
|||
0101 0001 |
0121 |
81 |
0x51 |
Q
|
Q majuscule |
|||
0101 0010 0101 01 11 |
0123 | 83 | 0x53 | S | Capitale 101 0100 | |||
0124 | 84 | 0x 54 | T | Capital T | 0101 0101 | |||
0125 | 85 | 0x55 | U | Capitale U | 0101 0110 | |||
0126 | 86 |
0x56 | V | Capital V | 0101 0111 | |||
0127 | 87 | 0x57 | W | lettres majuscules W | 0101 1000 | |||
0130 | 88 | 0x58 | X | Lettre majuscule | 890x59 | |||
Y |
Capital Y |
0101 1010 | 01 32 | 90 | 0x5A |
Z |
Capital Z |
|
0101 1011 |
0133 |
91 |
0x5B |
[ |
Supports d'ordonnance |
|||
0101 1100 |
0134 |
92 |
0x5C |
Dos cils
|
||||
0101 1101 |
0135 |
93 |
0x5D |
] |
Crochets fermants |
|||
0101 1110 |
0136 |
94
|
0x5E |
^ |
Caret |
|||
0101 1111 |
0137 |
95 |
0x5F |
_ |
sous score |
|||
0000 |
0140 |
96 |
0x60 |
` |
guillemet simple ouvert |
|||
0110 0001 |
0141
|
97
|
0x61 |
a |
inférieur cas a |
|||
0110 0010 |
0142 |
98 |
0x62 | b |
minuscule b
|
|||
0110 0011 |
0143 |
99 |
0x63 |
c |
c minuscule |
|||
01 10 0100 |
0144
|
100 |
0x64 |
d |
minuscule d |
|||
0110 0101 |
0145 |
101 |
0x65
|
e |
e minuscule |
|||
0110 0110 |
0146 |
102 |
0 x66 |
f |
minuscule f |
|||
0110 0111 |
0147 |
103 |
0x67 |
g |
minuscule g | |||
0110 1000 |
0150 |
104 | 0x68 |
h |
hminuscule |
|||
0110 1001 |
0151 |
105 |
0x69 |
i |
lettres minuscules i |
|||
0110 1010 |
0152 |
106 |
0x6A |
j | minuscule j
|
|||
0110 1011 |
0153 | 107 |
0x6B |
k |
minuscule k |
|||
0110 1100 |
0 154 |
108 |
0x6C |
l | minuscule l |
|||
0110 1101 |
0155 |
109 |
0x6D |
m
|
minuscule m |
|||
0110 1110 |
0156
|
110 |
0x6E |
n |
minuscule n |
|||
0110 111 |
0157 |
111 |
0x6F | o |
minuscule o |
|||
0111 0000 |
0160 |
112 |
0 x70 |
p |
minuscule p |
|||
0111 |
0161 |
113 |
0 x71 |
q |
minuscule q |
|||
0111 0010 |
0162 |
114 |
0x72 |
r |
minuscule r |
|||
0111 0011 | 0163 | 115 |
0x73 | s | minuscule s | |||
0111 0100 | 0164 | 11 6 | 0x74 | t | lettres minuscules t | |||
0111 0101 | 0165 | 117 | 0x75 | u | minuscule u | |||
0111 0110 | 0166 |
118 | 0x76 | v | minuscule v | |||
0111 | 0 167 | 119 | 0x77 | w |
minuscule w | |||
0111 1000 | 0170 | 120 | 0x78 | x | minuscule x | |||
0111 1001 |
0171 | 121 | 0x79 | y | minuscule y | |||
0 111 1 010 | 0172 | 122 | 0x7A |
z | minuscule z | |||
0111 1011 | 0173 | 123 |
0x7B | { |
parenthèses d'ouverture |
|||
0111 1100 |
0174 |
124 |
0 x 7C |
| |
ligne verticale |
|||
0111 1101
|
0175 |
125 |
0x7D |
} |
Fermeture d'accolades | |||
0111 1110 |
0176 |
126 |
0x7E
|
~ |
tilde |
|||
0111 1111 |
0177 |
127 |
0x7F |
DEL (supprimer) |
supprimer |
Règles de taille
Règles de taille pour les codes ASCII courants : chiffres
Les chiffres sont plus petits que les lettres. Par exemple, "7"
Le chiffre 0 est plus petit que le chiffre 9 et augmente dans l'ordre de 0 à 9. Par exemple, "3"
La lettre A est plus petite que la lettre Z et augmente dans l'ordre de A à Z. Par exemple, "A"
Les lettres majuscules de la même lettre sont 32 fois plus petites que les lettres minuscules. Tel que "A"
La taille du code ASCII de plusieurs lettres courantes : "A" est 65 ; "a" est 97 ; "0" est 48.
Pour plus de connaissances connexes, veuillez visiter la rubrique FAQ !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!