Heim >häufiges Problem >Wie viele Bytes belegt ein ASCII-Code?
Ein ASCII-Code belegt ein Byte und ist ein Codierungsstandard zur Darstellung von Zeichen. Er verwendet 7-Bit-Binärzahlen zur Darstellung von 128 verschiedenen Zeichen, einschließlich Buchstaben, Zahlen, Satzzeichen, Sonderzeichen usw. Ein Byte ist die Grundeinheit der Computerspeichereinheit. Es besteht aus 8 Binärbits. Jedes Binärbit kann 0 oder 1 sein. Ein Byte kann 256 verschiedene Werte darstellen, also alle Zeichen im ASCII-Code.
Das Betriebssystem dieses Tutorials: Windows 10-System, DELL G3-Computer.
ASCII-Code (American Standard Code for Information Interchange) ist ein Codierungsstandard zur Darstellung von Zeichen. Er verwendet 7-Bit-Binärzahlen, um 128 verschiedene Zeichen darzustellen, einschließlich Buchstaben, Zahlen, Satzzeichen, Sonderzeichen usw. In Computern werden ASCII-Codes normalerweise durch 8-Bit-Binärzahlen dargestellt, d. h. ein ASCII-Code belegt ein Byte (8 Bit) Speicherplatz.
ASCII-Codezeichen werden im Computer durch 7-Bit- oder 8-Bit-Binärkodierung dargestellt und in einem Byte gespeichert, d. h. ein ASCII-Code belegt ein Byte.
Ein Byte (Byte) ist die Grundeinheit der Computerspeichereinheit. Es besteht aus 8 Binärbits, jedes Binärbit kann 0 oder 1 sein. Ein Byte kann 256 (2^8) verschiedene Werte darstellen, also alle Zeichen im ASCII-Code darstellen.
Es ist zu beachten, dass mit der Entwicklung der Computertechnologie und der Forderung nach Internationalisierung ASCII-Codes nach und nach durch universellere Codierungsstandards wie Unicode ersetzt wurden. Unicode verwendet 16 oder 32 Bit zur Darstellung von Zeichen und kann mehr Zeichensätze darstellen, einschließlich Zeichen und Symbole in verschiedenen Sprachen.
Bei Verwendung der Unicode-Codierung kann ein Zeichen mehrere Bytes Speicherplatz belegen. Die spezifische Anzahl der belegten Bytes hängt vom verwendeten Unicode-Codierungsschema ab, z. B. UTF-8, UTF-16 oder UTF-32 usw. UTF-8 ist ein gängiges Unicode-Kodierungsschema, das eine Kodierung mit variabler Länge verwendet. Die Kodierungslänge eines Zeichens kann zwischen 1 und 4 Byte liegen.
Zusammenfassend lässt sich sagen, dass ein ASCII-Code normalerweise ein Byte (8 Bit) Speicherplatz belegt. Bei der weit verbreiteten Anwendung der Unicode-Codierung kann ein Zeichen jedoch mehrere Bytes Speicherplatz belegen. Die spezifische Anzahl der belegten Bytes hängt vom verwendeten Unicode-Codierungsschema ab.
ASCII-Code kann in Standard-ASCII-Code und erweiterten ASCII-Code unterteilt werden.
Standard-ASCII-Code wird auch Basis-ASCII-Code genannt. Er verwendet 7 Binärziffern (die verbleibende 1 Binärziffer ist 0), um alle Groß- und Kleinbuchstaben, Zahlen 0 bis 9, Satzzeichen und die im amerikanischen Englisch verwendeten Zeichen darzustellen. Spezielle Steuerzeichen. Darunter:
0~31 und 127 (insgesamt 33) sind Steuerzeichen oder kommunikationsspezifische Zeichen (der Rest sind anzeigbare Zeichen)
z. B. Steuerzeichen: LF (Zeilenvorschub), CR (Wagenrücklauf) , FF (Rückseite), DEL (Löschen), BS (Rücktaste), BEL (Ring) usw.;
Sonderzeichen für die Kommunikation: SOH (Textkopf), EOT (Textende), ACK (Bestätigung). ) usw.;
Der ASCII-Wert ist 8, 9, 10 und 13 und wird jeweils in Rücktaste, Tabulator, Zeilenvorschub und Wagenrücklauf umgewandelt. Sie verfügen nicht über eine spezifische grafische Darstellung, haben aber je nach Anwendung unterschiedliche Auswirkungen auf die Textdarstellung.
32~126 (insgesamt 95) sind Zeichen (32 ist ein Leerzeichen), davon sind 48~57 zehn arabische Ziffern von 0 bis 9.
65~90 sind 26 englische Großbuchstaben, 97~122 sind 26 englische Kleinbuchstaben und der Rest sind einige Satzzeichen, Rechenzeichen usw.
Beachten Sie außerdem, dass im Standard-ASCII das höchste Bit (b7) als Paritätsbit verwendet wird. Die sogenannte Paritätsprüfung bezeichnet eine Methode zur Überprüfung, ob bei der Codeübertragung Fehler auftreten. Sie wird im Allgemeinen in zwei Arten unterteilt: die ungerade Prüfung und die gerade Prüfung. Regeln für ungerade Parität: Die Anzahl der Einsen in einem Byte des korrekten Codes muss eine ungerade Zahl sein. Wenn es sich nicht um eine ungerade Zahl handelt, addieren Sie 1 zum höchsten Bit. b7 Regeln für gerade Parität: Die Anzahl der Einsen in einem Byte des Der korrekte Code muss eine gerade Zahl sein. Wenn es sich nicht um eine gerade Zahl handelt, addieren Sie 1 zum höchsten Bit b7.
Die letzten 128 werden als erweiterte ASCII-Codes bezeichnet. Viele x86-basierte Systeme unterstützen die Verwendung von erweitertem (oder „hohem“) ASCII. Erweitertes ASCII ermöglicht die Verwendung des 8. Bits jedes Zeichens zur Bestimmung zusätzlicher 128 Sonderzeichen, Fremdbuchstaben und Grafiksymbole.
Die ASCII-Code-Standardtabelle lautet wie folgt:
Bin
(binär)
|
Okt
(oktal)
|
Dez
(dezimal)
|
Hex
(hex)
|
Abkürzung/Zeichen | Erklärung
|
||
0000 0000 |
00? 001 |
01 |
1 |
0x01 |
0x02 | ||
Text beginnt | 0000 0011 | 03 | 3 | 0x03 | |||
Ende des Textes | 0000 0100 | 04 | 4 |
0x04 |
EOT (Ende der Übertragung) |
Ende der Übertragung |
|
0000 0101 |
. 05
|
5 |
0x05 | ENQ (Anfrage) |
Anfrage |
||
0000 0110 |
06 |
6 |
0x06
|
ACK (bestätigen) |
Benachrichtigung erhalten |
||
0000 0111 |
07 |
7 |
0x07 |
BEL (Glocke) |
|||
0000 1000 |
010 | 8 |
0x08 |
BS (Rücktaste) |
Rücktaste |
||
0000 1001 |
0. 11 |
9 |
0x09 |
HT (horizontale Registerkarte) |
Horizontale Registerkarte |
||
0000 1010 |
012 |
10 |
0x0A |
LF (NL-Zeilenvorschub, neue Zeile)
|
Zeilenvorschubtaste | ||
0000 1011 |
013 |
11 |
0x0B |
VT (vertikale Registerkarte) |
Vertikale Registerkarte | ||
0000 1100 | 014 |
12 | 0x0C | FF (NP-Formular-Feed, neue Seite) | Seitenschlüssel | ||
0000 1101 | 015 | 13 | 0x0D | CR (Wagenrücklauf) | Eingabetaste | ||
0000 1110 | 016. | 14 |
0x0E | SO (Schicht raus) | Kein Wechsel nötig | ||
0000 1111 0001 000
|
020 | 16 |
|
DLE (Datenlink-Escape) | Datenlink-Escape | ||
0001 0001 | 021 |
|
0x11 | DC1 (Gerätesteuerung 1) | Gerätesteuerung 1 | ||
0001. 0010 | 022 | 18 | 0x12 | |
Gerätesteuerung 2 | ||
0001. 0011 | 023 | 19 | 0 x13 | DC3 (Gerätesteuerung 3) |
|
||
0001 0100 | 024 | 20 | 0x14 | DC4 (Gerätesteuerung 4) |
Gerätesteuerung 4 |
||
0001 0101 |
025 |
21 | 0x15
|
NAK (negative Bestätigung) | Abgelehnt |
||
0001 0110 |
026 |
22 |
0x16 |
SYN. (synchron ous im Leerlauf) |
Sync im Leerlauf |
||
0001 0111 |
027 |
23 |
0x17 |
ETB (Ende des Übertragungsblocks) |
Ende des Übertragungsblocks |
||
0001 1000
|
030 | 24 1 |
25 | 0x19 | EM ( Ende des Mediums) | ||
0001 1010 |
032 |
26 |
0x1A |
SUB. (Ersatz) |
Statt
|
||
0001 1011 |
033 | 27 |
0x1B |
ESC (Escape) |
Escape (Überlauf) |
||
0001 1100 | 034 |
28 |
0x1C | FS (Dateitrennzeichen) |
Dateitrennzeichen |
||
0001 1101 |
035 |
29 |
0x. 1 D |
GS (Gruppentrennzeichen) |
Gruppierungssymbol |
||
0001 1110 |
036 |
30 |
0x1E |
RS (Datensatztrennzeichen) |
Datensatztrennzeichen |
||
0001 1111 | 037 |
31 |
0x1F |
US (Einheitentrennzeichen) |
Einheitentrennzeichen |
||
0010 0000 |
040
|
32 |
0x20 | (space)
|
space |
||
0010 0001 |
041 |
33 |
0x21 |
! |
Ausrufezeichen |
||
0010 0010 0010 0011 |
043 | 35 | 0x23 | # | Hashtag | ||
0010 0100 | 044 | 36 |
|
$ | Dollarzeichen |
||
0010 0101 |
045 |
37 |
0x25 |
% |
Prozentzeichen |
||
0010 0110 | 046
|
38 |
0x26 |
& |
和号 |
||
0010. 0111 |
047 |
39 |
0x27 |
'
|
Einfache Anführungszeichen schließen |
||
0010 1000 |
050 |
40 |
0x28 . | ( |
offene Klammer |
||
0010 1001 |
051 |
41 # 10 1010 |
052 |
42 |
0x2A |
* |
star |
0010 1011 |
053. |
43 |
0x2B |
+ | Plus
|
||
0010 1100 |
054 |
44 |
0x2C |
, | Komma |
||
0010 1101 |
055 | 45 |
0x2D |
- |
Minus/Strich |
||
0010 1110 |
056
|
46 |
0x2E |
. | Zeitraum |
||
0010 1111 |
057 |
47 |
0x2F |
/
|
Schrägstrich |
||
0011 0000 |
060 |
48 |
0x30 |
. 0 |
Zeichen 0 |
||
0011 0001 |
061.
| 06250 | 0x32 | 2 | Charakter 2 | ||
0011 0011 | 063 | 51 | 0x33 | Charakter 3 | |||
0011 0100 | | 06452 | 0x34 | 4 | Charakter 4 | ||
0011 0101. | 065 | 53 066 | 54 | 0x36 | 6 | ||
0011 0111 | 067 | 55 | 0x37 | 7. | Charakter 7 | ||
0011 1000 | 070. 070 | 071
|
57 |
0x39 |
9 |
||
0011 1010 |
072 |
58 |
0x3A | :
|
Colon |
||
0011 1011 |
073 |
59 |
0x3B |
. ; |
Semikolon |
||
0011 1100 |
074 |
60 |
0x3C |
weniger als |
|||
0011 1101 |
. 075
|
61 |
0x3D |
= |
Gleichheitszeichen |
||
0011. 1110 |
076 |
62 |
0x3E |
>
|
ist größer als |
||
0011 1111 | 077 |
63 |
0x3F |
? |
Fragezeichen |
||
01 00 0000 |
0100 |
64 |
0x40 |
@ |
E-Mail-Symbol |
||
0100.0001 |
01 01 |
65 |
0x41 |
A | Hauptstadt A |
||
0100 0010 |
0102 |
66 |
0x42 |
B
|
Hauptstadt B |
||
0100 0011 0100 01 00 |
0104 | 68 | 0x44 | D | Hauptstadt 00 0101 | ||
0105 | 69 | 0x 45 | E | Hauptstadt E |
|||
0100 0110 |
0106 |
70 |
0x46 |
F
|
Hauptstadt F |
||
0100 0111 |
0107
|
71 |
0x47 |
G |
Hauptstadt G |
||
0100 10 00 |
0110 |
72 |
0x48 |
H
|
Hauptstadt H |
||
0100 1001 |
0111 |
73 |
0x 49 |
I |
Großbuchstabe I |
||
01001010 | 0100 10110113 | 75 14 | 76 | 0x4C | L |
||
0100 1101 | 0115 | 77 | 0x4D | M | |||
0100 1110 | 0116 | 78 | 0x4E | N | |||
0100 11 11 |
0117 | 79 | 0x4F | O | |||
0101 0000 | 0120 | 80 | 0x 50 |
P | Hauptstadt P |
||
0101 0001 |
0121 |
81 |
0x51 |
Q
|
Hauptstadt Q |
||
0101 0010 0101 01 11 |
0123 | 83 | 0x53 | S | Hauptstadt 0101 0100 | ||
0124 | 84 | 0x 54 0x55 | U | Hauptstadt U | |||
0126 | 86 |
0x56 |
V |
Hauptstadt V |
|||
0101. 0111 |
01 27 |
87 |
0x57 |
W |
Hauptstadt W |
||
0101 1000 |
0130 |
88 |
0x58 |
X
|
Großbuchstabe |
||
89 | 0x59
|
0x5A |
Z |
Hauptstadt Z |
0101 1011 | ||
0133 |
91 |
0x 5B |
[ |
Offene eckige Klammern |
|||
0101 1100 |
0134 |
92 |
0x5C |
Backslash |
|||
0101 1101 | 0135 |
0136 | 94 | 0x5E | ↑ _ | ||
Unterstrich | 0110 0000 | 0140 |
0141 | 97 |
0x61 |
a |
Kleinbuchstabe a |
0110. 0010 |
0 1 42 |
98 |
0x62 |
b |
Kleinbuchstaben b |
||
0110 0011 |
0143 |
99 |
0x63 |
c
|
Kleinbuchstaben c |
||
0110 0100 0110 0 101 |
0145 | 101 | 0x65 | e | Kleinbuchstaben e | ||
0110 0110 | 0146 | 102 | 0 x66 | f | Kleinbuchstaben f |
||
0110 0111 |
0147 |
103 |
0x67 |
. g
|
Kleinbuchstaben g |
||
0110 1000 |
0150 |
104 |
0x68 |
h |
Kleinbuchstaben h |
||
0110. 1 001 |
0151 |
105 |
0x69 |
i |
Kleinbuchstaben i |
||
0110. 1010 |
0152 |
106 |
0 x6A |
j |
Kleinbuchstabe j |
||
0110 1011 |
0153 |
107 |
0x6B |
k |
Kleinbuchstaben k |
||
0110 1100 |
0154 |
108 |
0x6C |
l |
Kleinbuchstaben l |
||
0110. 1101 |
0 155 |
109 |
0x6D |
m |
Kleinbuchstaben m |
||
0110. 1110 |
0156 |
110 | nKleinbuchstaben n |
0110 1111 0111 0 000 |
|||
0160 | 112 | 0x70 |
p | Kleinbuchstaben p | 0111 0001 | ||
0161 | 113 | 0 x71 | q | Kleinbuchstaben q |
|||
0111 0010 |
0162 |
114 |
0x72 |
. r
|
Kleinbuchstabe r |
||
0111 0011 0111 0 100 |
0164 | 116 | 0x74 | t | Kleinbuchstaben t | ||
0111 0101 | 0165 | 117 | 0 x75 8
|
0x76 |
v |
||
0111 0111 |
0167 |
119 |
0x77 |
w |
Kleinbuchstaben w |
||
0111. 1000 |
0 170 |
120 |
0x78 |
x |
Kleinbuchstabe y |
||
Kleinbuchstabe y | 0111 1010 | 0172 | 122 | 0x7A | z | ||
Kleinbuchstabe z | 0111 1 011 | 0173 | 123 | 0x7B | { | ||
Klammern öffnen | 0111 1100 | 0174 | 124 | 0x 7C | | | Vertikale Linie |
|
0111 1101 |
0175 |
125 |
0x7D |
}
|
Schließklammer |
||
0111 1110 | 0176 | 0177127 | 0x7F | DEL (Löschen) | Löschen | ||
Größenregeln | Gemeinsame ASCII-Codegrößenregeln: Zahlen Zahlen sind kleiner als Buchstaben. Beispiel: „7“ Die Zahl 0 ist kleiner als die Zahl 9 und steigt in der Reihenfolge von 0 bis 9. Beispiel: „3“ Der Buchstabe A ist kleiner als der Buchstabe Z und steigt in der Reihenfolge von A bis Z. Beispiel: „A“ Die Großbuchstaben desselben Buchstabens sind 32 kleiner als die Kleinbuchstaben. Zum Beispiel „A“
Die ASCII-Codegrößen mehrerer gebräuchlicher Buchstaben: „A“ ist 65; „a“ ist 97;
Das obige ist der detaillierte Inhalt vonWie viele Bytes belegt ein ASCII-Code?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!