Heim >häufiges Problem >Wie viele Bytes belegt ein ASCII-Zeichen?

Wie viele Bytes belegt ein ASCII-Zeichen?

青灯夜游
青灯夜游Original
2023-03-09 15:49:0524066Durchsuche

Ein ASCII-Zeichen belegt 1 Byte. ASCII-Codezeichen werden im Computer durch 7-Bit- oder 8-Bit-Binärcodierung dargestellt und in einem Byte gespeichert, dh ein ASCII-Code belegt ein Byte. ASCII-Code kann in Standard-ASCII-Code und erweiterten ASCII-Code unterteilt werden. Der Standard-ASCII-Code wird auch als Basis-ASCII-Code bezeichnet. Er verwendet 7-Bit-Binärzahlen (die verbleibende 1 Binärziffer ist 0), um alle Groß- und Kleinbuchstaben darzustellen Zahlen von 0 bis 9. Satzzeichen und spezielle Steuerzeichen, die im amerikanischen Englisch verwendet werden.

Wie viele Bytes belegt ein ASCII-Zeichen?

Die Betriebsumgebung dieses Tutorials: Windows 7-System, Dell G3-Computer.

ASCII (American Standard Code for Information Interchange): Der American Standard Code for Information Interchange ist ein Computercodierungssystem, das auf dem lateinischen Alphabet basiert und hauptsächlich zur Darstellung von modernem Englisch und anderen westeuropäischen Sprachen verwendet wird.

ASCII-Code verwendet eine bestimmte 7-Bit- oder 8-Bit-Binärzahlenkombination, um 128 oder 256 mögliche Zeichen darzustellen.

ASCII-Codezeichen werden in Computern durch 7-Bit- oder 8-Bit-Binärcodierung dargestellt und in einem Byte gespeichert, dh ein ASCII-Code belegt ein Byte.

Wie viele Bytes belegt ein ASCII-Zeichen?

ASCII-Code kann in Standard-ASCII-Code und erweiterten ASCII-Code unterteilt werden.

Standard-ASCII-Code wird auch als Basis-ASCII-Code bezeichnet, der 7 Binärziffern (die verbleibende 1 Binärziffer ist 0) verwendet, um alle Groß- und Kleinbuchstaben, Zahlen 0 bis 9 und Satzzeichen darzustellen sowie spezielle Steuerzeichen, die im amerikanischen Englisch verwendet werden. Darunter: 标准ASCII码也叫基础ASCII码,使用7位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0到9、标点符号,以及在美式英语中使用的特殊控制字符。其中:

  • 0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符)

    如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;

    通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;

    ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。

  • 32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。

  • 65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。

同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。

后128个称为扩展ASCII码。

  • 0~31 und 127 (insgesamt 33) sind Steuerzeichen oder kommunikationsspezifische Zeichen (der Rest sind anzeigbare Zeichen)

    wie Steuerzeichen: LF (Zeilenvorschub), CR (Wagenrücklauf), FF (Seitenvorschub), DEL (Löschen), BS (Rücktaste), BEL (Glocke) usw.;

    Sonderzeichen für die Kommunikation: SOH ( Header), EOT (Ende des Textes), ACK (Bestätigung) usw.;
  • 32~126 (insgesamt 95) sind Zeichen (32 ist ein Leerzeichen), davon sind 48~57 zehn arabische Ziffern von 0 bis 9.
  • ASCII-Tabelle010000 01100001. 00000200001 00010210001 0010 022 0x13DC3 (Gerätesteuerung 3)Gerätesteuerung 30x14DC4 (Gerät Steuerung 4)Gerätesteuerung 40x15NAK (negative Bestätigung)Zu empfangen ablehnen0x16SYN (synchroner Leerlauf)synchroner Leerlauf0x17ETB (Ende des Trans.-Blocks)0001 1001 031250x190 001 1010032260x1A0001 1011033 270x1B0001 1100034280x1C0001 1101035290x1D0001 1110036300x1E0001. 1111037 310x1F0010 0000040320x20 0010 0001041330x210010 0010042340x22. . . 0011 1010072 58 ;=>?@A B 0100 01 010100 01100x4AJCapital J 0x4BKHauptstadt K0x4CLCapital L0x4DM Hauptstadt M0x4ENHauptstadt N79 20800x50PHauptstadt P0101 00010121810x51QHauptstadt Q0101 0010Hauptstadt 0101 010089... niedriger Fall aKleinbuchstaben bKleinbuchstaben cKleinbuchstaben d 0x68 50x69iKleinbuchstaben i 0110 101001521060x6AjKleinbuchstabe j0110 10110153Kleinbuchstaben lKleinbuchstaben mKleinbuchstaben nKleinbuchstaben oxKleinbuchstabe x0x79yKleinbuchstaben y 0x7AzKleinbuchstabe z0 x7BtildelöschenDie Großbuchstaben desselben Buchstabens sind 32 kleiner als die Kleinbuchstaben. Zum Beispiel „A“
    ASCII-Werte 8, 9, 10 und 13 werden jeweils in Rückschritt-, Tabulator-, Zeilenvorschub- und Wagenrücklaufzeichen umgewandelt. Sie verfügen nicht über eine spezifische grafische Darstellung, haben aber je nach Anwendung unterschiedliche Auswirkungen auf die Textdarstellung.
    65~90 sind 26 englische Großbuchstaben, 97~122 sind 26 englische Kleinbuchstaben und der Rest sind einige Satzzeichen, Rechenzeichen usw.
    Beachten Sie außerdem, dass im Standard-ASCII das höchste Bit (b7) als Paritätsbit verwendet wird. Die sogenannte Paritätsprüfung bezeichnet eine Methode zur Überprüfung, ob bei der Codeübertragung Fehler auftreten. Sie wird im Allgemeinen in zwei Arten unterteilt: die ungerade Prüfung und die gerade Prüfung. Die ungerade Parität legt fest: Die Anzahl der Einsen in einem Byte des korrekten Codes muss eine ungerade Zahl sein. Wenn es sich nicht um eine ungerade Zahl handelt, addieren Sie 1 zum höchsten Bit. b7 Die gerade Parität legt fest: die Anzahl der Einsen in einem Byte des Der korrekte Code muss eine gerade Zahl sein. Wenn es sich nicht um eine gerade Zahl handelt, addieren Sie 1 zum höchsten Bit b7.
    Die letzten 128 Zeichen von werden als erweiterte ASCII-Codes bezeichnet. Viele x86-basierte Systeme unterstützen die Verwendung von erweitertem (oder „hohem“) ASCII. Erweitertes ASCII ermöglicht die Verwendung des 8. Bits jedes Zeichens zur Bestimmung zusätzlicher 128 Sonderzeichen, Fremdbuchstaben und Grafiksymbole.
    ASCII-Code-Standardtabelle ist wie folgt
    Bin
    (binär)
    Oct
    (oktal)
    Dez
    (dezimal)
    Hex
    (Hex)
    Abkürzung/Zeichen
    Erklärung
    0000 0000
    00
    0x00
    NUL (null)
    Nullzeichen
    0000 0001
    01
    0x01
    SOH(Anfang der Überschrift)🎜🎜🎜🎜Titelanfang🎜 🎜🎜🎜🎜 🎜0000 0010🎜🎜🎜🎜02🎜
    2
    0x02
    STX (Anfang des Textes)
    Anfang des Textes
    0000 0011
    .
    03
    3
    0x03
    ETX (Ende des Textes)
    Ende des Textes
    0000 0100
    04
    4
    0x04
    EOT (Ende der Übertragung)
    Übertragungsende
    0000 F (Anfrage)
    Anfrage
    06 0 0111
    07
    7
    0x07
    BEL (Glocke)
    Glocke
    0000 1000
    010
    8
    0x08
    BS (Rücktaste)
    Zurück Raster
    0000 1001
    011
    9
    0x09
    HT (horizontal. Tab)
    Horizontale Registerkarte
    0000 1010
    012
    10
    0x0A
    LF (NL-Zeilenvorschub, neue Zeile)
    Zeilenvorschub
    0 000 1
    013
    11
    0x0B
    VT (vertikale Registerkarte)
    vertikale Registerkarte
    0000 1100
    014
    12
    0x0C
    FF (NP Seitenvorschub, neue Seite)
    Seitentaste
    0000 1101
    015
    13
    0x0D
    CR (Wagenrücklauf)
    Eingabetaste
    00 0 0 1110
    016
    14
    0x0E
    SO (Ausschalten)
    Kein Wechsel nötig
    0000 15 
    0x0F
    SI (Umschalten)
    Schaltung aktivieren
    16
    0x10
    DLE (Datenlink-Escape)
    Datenlink-Escape
    17
    0x11
    DC1 (Gerätesteuerung 1)
    Gerätesteuerung 1
    18
    0x12
    DC2 (Gerätesteuerung 2)
    Gerätesteuerung 001 0011
    023
    19
    0001 0100
    024
    20
    0001 0101
    025
    21
    0001 0110
    026
    22
    0001 0111
    027
    23
    Übertragungsblock beenden
    0001 C AN (abbrechen)
    Abbrechen
    EM (Ende des Mediums)
    Ende des Mediums
    SUB (Ersatz)
    statt
    ESC ( Escape)
    Escape (Überlauf)
    FS (Dateitrennzeichen)
    Dateitrennzeichen
    GS (Gruppentrennzeichen)
    Gruppe Symbol
    RS (Datensatztrennzeichen)
    Datensatztrennzeichen
    US (Einheitentrennzeichen)
    Einheitentrennzeichen
    (Leerzeichen)
    Leerzeichen
    !
    Ausrufezeichen
    .
    "
    doppelte Anführungszeichen
    0011
    043
    35
    0x 23
    #
    hashtag
    0010 0100
    0010 0101
    045
    37
    0x25
    %
    Prozentzeichen
    0010 0110
    046
    38
    0x26
    &
    Und#
    0010 0111
    047
    39
    0x27
    '
    Schließen Sie einfache Anführungszeichen
    0010 1000
    050
    40
    0x28
    (
    offene Klammer
    0010 1001
    051
    41
    0x29
    )
    Schließende Klammer
    0010 1010
    052
    42
    0x2A
    *
    .
    Stern
    0010 1011
    053
    43
    0x2B
    +
    plus
    0010 1100
    054
    .
    44
    0x2C
    ,
    Komma
    0010 1101
    055
    45
    0x2D
    -
    Minus/Strich
    0010 1110
    056
    46
    0x2E
    .
    Zeitraum
    0010 1111
    057
    47
    0x2F
    /
    Schrägstrich
    0011 0000
    060
    48
    0x30
    0
    Zeichen 0
    0011 0001
    061
    49
    0x31
    1
    Charakter 1
    0011 0010
    062
    50
    0x32
    2
    Charakter 2
    0011 011
    063
    51
    0x33
    3
    Charakter 3
    0011 0100
    064
    52
    0x34
    4
    Charakter 4
    0011 0101
    065
    53
    0x35
    5
    Charakter 5
    0 011 0110
    066
    54
    0x36
    6
    Charakter 6
    0011 0111
    067
    55
    0x37
    7
    Zeichen 7
    0011 1000
    070
    56
    0x38
    8
    Zeichen 8
    0011. 1001 ers 9
    59
    0x3B
    Semikolon
    0011 1100
    074
    60
    0x3C
    weniger als
    0011 1101
    075
    61
    0x3D
    Gleichheitszeichen
    0011 1110
    076
    62
    0x3E
    ist größer als
    0011 1111
    077
    63
    0x3F
    Fragezeichen
    0100 0000
    0100
    64
    0x40
    E-Mail-Symbol
    0100 0001
    0101
    65
    0x41
    Hauptstadt A
    0100 0010
    0102
    66
    0x42
    Hauptstadt B
    0100 0011
    0100 0100
    0105
    69
    0x45
    E
    Hauptstadt
    0106
    70
    0x 46
    0x47
    G
    Hauptstadt G
    0100 1000
    0110
    72
    0x48
    H
    Hauptstadt H
    0100 1001
    0111
    73
    0x49
    I
    Großbuchstaben
    74
    0100 1011
    0113
    75
    0100 1100
    0114
    76
    0100 1101
    0115
    77
    0100 1110
    0116
    78
    0100 1111
    0117
    0101 01 11
    0123
    83
    0x53
    S
    0124
    84
    0x 54
    0x55
    U
    Hauptstadt U
    0101 0110
    0126
    86
    0x56
    V
    Hauptstadt V
    0101 0111
    0127
    87
    0x57
    W
    Großbuchstaben W
    0101 1000
    0130
    88
    0x58
    X
    Großbuchstabe
    90
    0x5A
    Z
    Hauptstadt Z
    0101. 1011
    0133
    91
    0x5B
    [
    Rezeptklammern
    0101 1100
    0134
    92
    0x5C
    Zurück Schrägstrich
    0101 1101
    0135
    93
    0x5D
    ]
    Schließende eckige Klammern
    0101 1110
    0136.
    94
    0x5E
    ^
    Caret
    0101 1111
    0137
    95
    0x5F
    _
    unter Punktzahl
    0110 0000
    0140
    96
    0x60
    97
    0x61
    a
    0110 0010
    0142
    98
    0x62
    b
    0110 0011
    0143
    99
    0x63
    c
    01 10. 0100
    0144
    100
    0x64
    d
    0110 0101
    0145
    101
    0x65
    e
    Kleinbuchstabe e
    0110 0110
    0146
    102
    0 x66
    f
    Kleinbuchstaben f
    0110 0111
    0147
    103
    0x67
    g
    Kleinbuchstaben g
    0110 1000
    0150
    104
    107 4
    108
    0x6C
    l
    0110 1101
    0155
    109
    0x6D
    .
    m
    0110 1110
    0156
    110
    0x6E
    n
    0110 1 111
    0157
    111
    0x6F
    o
    0000
    0160
    112
    0. x70
    p
    Kleinbuchstaben p
    0001
    0161
    113
    0 x71
    q
    Kleinbuchstaben q
    0111 0010
    0162
    114
    0x72
    r
    Kleinbuchstaben r
    0111 0011
    0163
    115
    0x73
    s
    Kleinbuchstaben s
    0111 0100
    0164
    116
    0x74
    t
    Kleinbuchstaben Buchstaben t
    0111 0101
    0165
    117
    0x75
    u
    Kleinbuchstaben u
    0111 0110
    0166
    118
    0x76
    v
    Kleinbuchstaben v
    0111 0111
    0 167
    119
    0x77
    w
    Kleinbuchstaben w
    0111
    0111 1001
    0171
    121
    0111 1 010
    0172
    122
    0111 1011
    0173
    123
    {
    öffnende Klammern
    0111. 1100
    0174
    124
    0x 7C
    |
    vertikale Linie
    0111 1101
    0111 1110
    0176
    126
    0x7E
    ~
    0111 1111
    0177
    127
    0x7F
    DEL (löschen)
    Größenregeln
    Größenregeln für gängige ASCII-Codes: Zahlen Zahlen sind kleiner als Buchstaben. Beispiel: „7“ Die Zahl 0 ist kleiner als die Zahl 9 und steigt in der Reihenfolge von 0 bis 9. Beispiel: „3“ Der Buchstabe A ist kleiner als der Buchstabe Z und steigt in der Reihenfolge von A bis Z. Beispiel: „A“

    Die ASCII-Codegrößen mehrerer gebräuchlicher Buchstaben: „A“ ist 65; „a“ ist 97; „0“ ist 48.

    Weitere Informationen zu diesem Thema finden Sie in der Spalte „FAQ

    “!

Das obige ist der detaillierte Inhalt vonWie viele Bytes belegt ein ASCII-Zeichen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn