Heim >häufiges Problem >Wie viele Bytes belegt ein ASCII-Code?

Wie viele Bytes belegt ein ASCII-Code?

百草
百草Original
2023-09-07 16:03:255995Durchsuche

Ein ASCII-Code belegt ein Byte und ist ein Codierungsstandard zur Darstellung von Zeichen. Er verwendet 7-Bit-Binärzahlen zur Darstellung von 128 verschiedenen Zeichen, einschließlich Buchstaben, Zahlen, Satzzeichen, Sonderzeichen usw. Ein Byte ist die Grundeinheit der Computerspeichereinheit. Es besteht aus 8 Binärbits. Jedes Binärbit kann 0 oder 1 sein. Ein Byte kann 256 verschiedene Werte darstellen, also alle Zeichen im ASCII-Code.

Wie viele Bytes belegt ein ASCII-Code?

Das Betriebssystem dieses Tutorials: Windows 10-System, DELL G3-Computer.

ASCII-Code (American Standard Code for Information Interchange) ist ein Codierungsstandard zur Darstellung von Zeichen. Er verwendet 7-Bit-Binärzahlen, um 128 verschiedene Zeichen darzustellen, einschließlich Buchstaben, Zahlen, Satzzeichen, Sonderzeichen usw. In Computern werden ASCII-Codes normalerweise durch 8-Bit-Binärzahlen dargestellt, d. h. ein ASCII-Code belegt ein Byte (8 Bit) Speicherplatz.

ASCII-Codezeichen werden im Computer durch 7-Bit- oder 8-Bit-Binärkodierung dargestellt und in einem Byte gespeichert, d. h. ein ASCII-Code belegt ein Byte.

Ein Byte (Byte) ist die Grundeinheit der Computerspeichereinheit. Es besteht aus 8 Binärbits, jedes Binärbit kann 0 oder 1 sein. Ein Byte kann 256 (2^8) verschiedene Werte darstellen, also alle Zeichen im ASCII-Code darstellen.

Es ist zu beachten, dass mit der Entwicklung der Computertechnologie und der Forderung nach Internationalisierung ASCII-Codes nach und nach durch universellere Codierungsstandards wie Unicode ersetzt wurden. Unicode verwendet 16 oder 32 Bit zur Darstellung von Zeichen und kann mehr Zeichensätze darstellen, einschließlich Zeichen und Symbole in verschiedenen Sprachen.

Bei Verwendung der Unicode-Codierung kann ein Zeichen mehrere Bytes Speicherplatz belegen. Die spezifische Anzahl der belegten Bytes hängt vom verwendeten Unicode-Codierungsschema ab, z. B. UTF-8, UTF-16 oder UTF-32 usw. UTF-8 ist ein gängiges Unicode-Kodierungsschema, das eine Kodierung mit variabler Länge verwendet. Die Kodierungslänge eines Zeichens kann zwischen 1 und 4 Byte liegen.

Zusammenfassend lässt sich sagen, dass ein ASCII-Code normalerweise ein Byte (8 Bit) Speicherplatz belegt. Bei der weit verbreiteten Anwendung der Unicode-Codierung kann ein Zeichen jedoch mehrere Bytes Speicherplatz belegen. Die spezifische Anzahl der belegten Bytes hängt vom verwendeten Unicode-Codierungsschema ab.

Wie viele Bytes belegt ein ASCII-Code?

ASCII-Code kann in Standard-ASCII-Code und erweiterten ASCII-Code unterteilt werden.

Standard-ASCII-Code wird auch Basis-ASCII-Code genannt. Er verwendet 7 Binärziffern (die verbleibende 1 Binärziffer ist 0), um alle Groß- und Kleinbuchstaben, Zahlen 0 bis 9, Satzzeichen und die im amerikanischen Englisch verwendeten Zeichen darzustellen. Spezielle Steuerzeichen. Darunter:

  • 0~31 und 127 (insgesamt 33) sind Steuerzeichen oder kommunikationsspezifische Zeichen (der Rest sind anzeigbare Zeichen)

    z. B. Steuerzeichen: LF (Zeilenvorschub), CR (Wagenrücklauf) , FF (Rückseite), DEL (Löschen), BS (Rücktaste), BEL (Ring) usw.;

    Sonderzeichen für die Kommunikation: SOH (Textkopf), EOT (Textende), ACK (Bestätigung). ) usw.;

    Der ASCII-Wert ist 8, 9, 10 und 13 und wird jeweils in Rücktaste, Tabulator, Zeilenvorschub und Wagenrücklauf umgewandelt. Sie verfügen nicht über eine spezifische grafische Darstellung, haben aber je nach Anwendung unterschiedliche Auswirkungen auf die Textdarstellung.

  • 32~126 (insgesamt 95) sind Zeichen (32 ist ein Leerzeichen), davon sind 48~57 zehn arabische Ziffern von 0 bis 9.

  • 65~90 sind 26 englische Großbuchstaben, 97~122 sind 26 englische Kleinbuchstaben und der Rest sind einige Satzzeichen, Rechenzeichen usw.

Beachten Sie außerdem, dass im Standard-ASCII das höchste Bit (b7) als Paritätsbit verwendet wird. Die sogenannte Paritätsprüfung bezeichnet eine Methode zur Überprüfung, ob bei der Codeübertragung Fehler auftreten. Sie wird im Allgemeinen in zwei Arten unterteilt: die ungerade Prüfung und die gerade Prüfung. Regeln für ungerade Parität: Die Anzahl der Einsen in einem Byte des korrekten Codes muss eine ungerade Zahl sein. Wenn es sich nicht um eine ungerade Zahl handelt, addieren Sie 1 zum höchsten Bit. b7 Regeln für gerade Parität: Die Anzahl der Einsen in einem Byte des Der korrekte Code muss eine gerade Zahl sein. Wenn es sich nicht um eine gerade Zahl handelt, addieren Sie 1 zum höchsten Bit b7.

Die letzten 128 werden als erweiterte ASCII-Codes bezeichnet. Viele x86-basierte Systeme unterstützen die Verwendung von erweitertem (oder „hohem“) ASCII. Erweitertes ASCII ermöglicht die Verwendung des 8. Bits jedes Zeichens zur Bestimmung zusätzlicher 128 Sonderzeichen, Fremdbuchstaben und Grafiksymbole.

Die ASCII-Code-Standardtabelle lautet wie folgt:

STX (Textanfang) ETX (Ende des Textes)Ende des Mediums062500x32 2 Charakter 20011 0011063510x333Charakter 30011 0100064520x344Charakter 40011 0101. 06553 066 540x366Charakter 60011 0111067550x377. Charakter 70011 1000 070. 070 Zeichen 90100 10110113Hauptstadt LHauptstadt MHauptstadt NHauptstadt O0101 011001310101 1011nKleinbuchstaben nKleinbuchstaben v 01771270x7FDEL (Löschen)LöschenGemeinsame ASCII-Codegrößenregeln: Zahlen
Zahlen sind kleiner als Buchstaben. Beispiel: „7“
Die Zahl 0 ist kleiner als die Zahl 9 und steigt in der Reihenfolge von 0 bis 9. Beispiel: „3“
Der Buchstabe A ist kleiner als der Buchstabe Z und steigt in der Reihenfolge von A bis Z. Beispiel: „A“
Die Großbuchstaben desselben Buchstabens sind 32 kleiner als die Kleinbuchstaben. Zum Beispiel „A“
ASCII-Tabelle
Bin
(binär)
Okt
(oktal)
Dez
(dezimal)
Hex
(hex)
Abkürzung/Zeichen
Erklärung
0000 0000
00? 001
01
1
0x01
0x02
Text beginnt
0000 0011
03
3
0x03
Ende des Textes
0000 0100
04
4
0x04
EOT (Ende der Übertragung)
Ende der Übertragung
0000 0101
.
05
5
0x05
ENQ (Anfrage)
Anfrage
0000 0110
06
6
0x06
ACK (bestätigen)
Benachrichtigung erhalten
0000 0111
07
7
0x07
BEL (Glocke)
0000 1000
010
8
0x08
BS (Rücktaste)
Rücktaste
0000 1001
0. 11
9
0x09
HT (horizontale Registerkarte)
Horizontale Registerkarte
0000 1010
012
10
0x0A
LF (NL-Zeilenvorschub, neue Zeile)
Zeilenvorschubtaste
0000 1011
013
11
0x0B
VT (vertikale Registerkarte)
Vertikale Registerkarte
0000 1100
014
12
0x0C
FF (NP-Formular-Feed, neue Seite)
Seitenschlüssel
0000 1101
015
13
0x0D
CR (Wagenrücklauf)
Eingabetaste
0000 1110
016
.
14
0x0E
SO (Schicht raus)
Kein Wechsel nötig
0000 1111
0001 000
020
16
0x10
DLE (Datenlink-Escape)
Datenlink-Escape
0001 0001
021
17
0x11
DC1 (Gerätesteuerung 1)
Gerätesteuerung 1
0001. 0010
022
18
0x12
DC2 (Gerätesteuerung 2)
Gerätesteuerung 2
0001. 0011
023
19
0 x13
DC3 (Gerätesteuerung 3)
Gerätesteuerung 3
0001 0100
024
20
0x14
DC4 (Gerätesteuerung 4)
Gerätesteuerung 4
0001 0101
025
21
0x15
NAK (negative Bestätigung)
Abgelehnt
0001 0110
026
22
0x16
SYN. (synchron ous im Leerlauf)
Sync im Leerlauf
0001 0111
027
23
0x17
ETB (Ende des Übertragungsblocks)
Ende des Übertragungsblocks
0001 1000
030
24 1
25
0x19
EM ( Ende des Mediums)
0001 1010
032
26
0x1A
SUB. (Ersatz)
Statt
0001 1011
033
27
0x1B
ESC (Escape)
Escape (Überlauf)
0001 1100
034
28
0x1C
FS (Dateitrennzeichen)
Dateitrennzeichen
0001 1101
035
29
0x. 1 D
GS (Gruppentrennzeichen)
Gruppierungssymbol
0001 1110
036
30
0x1E
RS (Datensatztrennzeichen)
Datensatztrennzeichen
0001 1111
037
31
0x1F
US (Einheitentrennzeichen)
Einheitentrennzeichen
0010 0000
040
32
0x20
(space)
space
0010 0001
041
33
0x21
!
Ausrufezeichen
0010 0010
0010 0011
043
35
0x23
#
Hashtag
0010 0100
044
36
0 x24
$
Dollarzeichen
0010 0101
045
37
0x25
%
Prozentzeichen
0010 0110
046
38
0x26
&
和号
0010. 0111
047
39
0x27
'
Einfache Anführungszeichen schließen
0010 1000
050
40
0x28
.
(
offene Klammer
0010 1001
051
41 # 10 1010
052
42
0x2A
*
star
0010 1011
053.
43
0x2B
+
Plus
0010 1100
054
44
0x2C
,
Komma
0010 1101
055
45
0x2D
-
Minus/Strich
0010 1110
056
46
0x2E
.
Zeitraum
0010 1111
057
47
0x2F
/
Schrägstrich
0011 0000
060
48
0x30
. 0
Zeichen 0
0011 0001
061.
071
57
0x39
9
0011 1010
072
58
0x3A
:
Colon
0011 1011
073
59
0x3B
. ;
Semikolon
0011 1100
074
60
0x3C
weniger als
0011 1101
.
075
61
0x3D
=
Gleichheitszeichen
0011. 1110
076
62
0x3E
>
ist größer als
0011 1111
077
63
0x3F
?
Fragezeichen
01 00 0000
0100
64
0x40
@
E-Mail-Symbol
0100.0001
01 01
65
0x41
A
Hauptstadt A
0100 0010
0102
66
0x42
B
Hauptstadt B
0100 0011
0100 01 00
0104
68
0x44
D
Hauptstadt 00 0101
0105
69
0x 45
E
Hauptstadt E
0100 0110
0106
70
0x46
F
Hauptstadt F
0100 0111
0107
71
0x47
G
Hauptstadt G
0100 10 00
0110
72
0x48
H
Hauptstadt H
0100 1001
0111
73
0x 49
I
Großbuchstabe I
01001010
75 14
76
0x4C
L
0100 1101
0115
77
0x4D
M
0100 1110
0116
78
0x4E
N
0100 11 11
0117
79
0x4F
O
0101 0000
0120
80
0x 50
P
Hauptstadt P
0101 0001
0121
81
0x51
Q
Hauptstadt Q
0101 0010
0101 01 11
0123
83
0x53
S
Hauptstadt 0101 0100
0124
84
0x 54
0x55
U
Hauptstadt U
0126
86
0x56
V
Hauptstadt V
0101. 0111
01 27
87
0x57
W
Hauptstadt W
0101 1000
0130
88
0x58
X
Großbuchstabe
89
0x59
0x5A
Z
Hauptstadt Z
0133
91
0x 5B
[
Offene eckige Klammern
0101 1100
0134
92
0x5C
Backslash
0101 1101
0135
0136
94
0x5E
_
Unterstrich
0110 0000
0140
0141
97
0x61
a
Kleinbuchstabe a
0110. 0010
0 1 42
98
0x62
b
Kleinbuchstaben b
0110 0011
0143
99
0x63
c
Kleinbuchstaben c
0110 0100
0110 0 101
0145
101
0x65
e
Kleinbuchstaben e
0110 0110
0146
102
0 x66
f
Kleinbuchstaben f
0110 0111
0147
103
0x67
.
g
Kleinbuchstaben g
0110 1000
0150
104
0x68
h
Kleinbuchstaben h
0110. 1 001
0151
105
0x69
i
Kleinbuchstaben i
0110. 1010
0152
106
0 x6A
j
Kleinbuchstabe j
0110 1011
0153
107
0x6B
k
Kleinbuchstaben k
0110 1100
0154
108
0x6C
l
Kleinbuchstaben l
0110. 1101
0 155
109
0x6D
m
Kleinbuchstaben m
0110. 1110
0156
110
0110 1111
0111 0 000
0160
112
0x70
p
Kleinbuchstaben p
0111 0001
0161
113
0 x71
q
Kleinbuchstaben q
0111 0010
0162
114
0x72
.
r
Kleinbuchstabe r
0111 0011
0111 0 100
0164
116
0x74
t
Kleinbuchstaben t
0111 0101
0165
117
0 x75 8
0x76
v
0111 0111
0167
119
0x77
w
Kleinbuchstaben w
0111. 1000
0 170
120
0x78
x
Kleinbuchstabe
y
Kleinbuchstabe y
0111 1010
0172
122
0x7A
z
Kleinbuchstabe z
0111 1 011
0173
123
0x7B
{
Klammern öffnen
0111 1100
0174
124
0x 7C
|
Vertikale Linie
0111 1101
0175
125
0x7D
}
Schließklammer
0111 1110
0176
Größenregeln

Die ASCII-Codegrößen mehrerer gebräuchlicher Buchstaben: „A“ ist 65; „a“ ist 97;

Das obige ist der detaillierte Inhalt vonWie viele Bytes belegt ein ASCII-Code?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn