In der ASCII-Codedatei belegt ein englischer Buchstabe ein Byte und ein chinesisches Zeichen zwei Bytes. Der ASCII-Code verwendet eine bestimmte 7-Bit- oder 8-Bit-Binärzahlenkombination, um 128 oder 256 mögliche Zeichen darzustellen Ein Byte ist die Einheit binärer Daten, und ein Byte ist normalerweise 8 Bit lang.
Die Betriebsumgebung dieses Artikels: Windows 7-System, Dell G3-Computer.
Wie viele Bytes belegt ein englischer Buchstabe in der ASCII-Codedatei?
Im ASCII-Code belegt ein englischer Buchstabe (unabhängig von der Groß-/Kleinschreibung) ein Byte Platz und ein chinesisches Zeichen zwei Bytes.
ASCII:
ASCII ((American Standard Code for Information Interchange): American Standard Code for Information Interchange) ist ein Computercodierungssystem, das auf dem lateinischen Alphabet basiert und hauptsächlich zur Darstellung von modernem Englisch und anderen westeuropäischen Sprachen verwendet wird. Es ist der am weitesten verbreitete Standard für den Informationsaustausch und entspricht dem internationalen Standard ISO/IEC 646. ASCII wurde erstmals 1967 als standardisierter Typ veröffentlicht und zuletzt 1986 aktualisiert. Bisher wurden insgesamt 128 Zeichen definiert.
ASCII-Code verwendet eine bestimmte 7-Bit- oder 8-Bit-Binärzahlenkombination, um 128 oder 256 mögliche Zeichen darzustellen. Standard-ASCII-Code, auch Basis-ASCII-Code genannt, verwendet 7 Binärziffern (die verbleibende 1 Binärziffer ist 0), um alle Groß- und Kleinbuchstaben, Zahlen 0 bis 9, Satzzeichen und spezielle Steuerelemente darzustellen, die im amerikanischen Englisch verwendet werden. Zeichen[1] . Darunter:
0~31 und 127 (insgesamt 33) sind Steuerzeichen oder kommunikationsspezifische Zeichen (der Rest sind anzeigbare Zeichen), wie z. B. Steuerzeichen: LF (Zeilenvorschub), CR (Wagenrücklauf), FF ( Seitenvorschub), DEL (Löschen), BS (Rücktaste), BEL (Ring) usw.; Sonderzeichen für die Kommunikation: SOH (Textkopf), EOT (Textende), ASCII Die Werte sind 8, 9, 10 und 13. Konvertieren Sie in Rückschritt-, Tabulator-, Zeilenvorschub- und Wagenrücklaufzeichen. Sie verfügen nicht über eine spezielle grafische Darstellung, haben jedoch je nach Anwendung unterschiedliche Auswirkungen auf die Textdarstellung [1].
32~126 (insgesamt 95) sind Zeichen (32 ist ein Leerzeichen), davon sind 48~57 zehn arabische Ziffern von 0 bis 9.
65~90 sind 26 englische Großbuchstaben, 97~122 sind 26 englische Kleinbuchstaben und der Rest sind einige Satzzeichen, Rechenzeichen usw.
Beachten Sie außerdem, dass im Standard-ASCII das höchste Bit (b7) als Paritätsbit verwendet wird. Die sogenannte Paritätsprüfung bezeichnet eine Methode zur Überprüfung, ob bei der Codeübertragung Fehler auftreten. Sie wird im Allgemeinen in zwei Arten unterteilt: die ungerade Prüfung und die gerade Prüfung. Regeln für ungerade Parität: Die Anzahl der Einsen in einem Byte des korrekten Codes muss eine ungerade Zahl sein. Wenn es sich nicht um eine ungerade Zahl handelt, addieren Sie 1 zum höchsten Bit. b7 Regeln für gerade Parität: Die Anzahl der Einsen in einem Byte des Der korrekte Code muss eine gerade Zahl sein. Wenn es sich nicht um eine gerade Zahl handelt, addieren Sie 1 zum höchsten Bit b7.
Die letzten 128 werden als erweiterte ASCII-Codes bezeichnet. Viele x86-basierte Systeme unterstützen die Verwendung von erweitertem (oder „hohem“) ASCII. Erweitertes ASCII ermöglicht die Verwendung des 8. Bits jedes Zeichens zur Bestimmung zusätzlicher 128 Sonderzeichen, Fremdbuchstaben und Grafiksymbole.
Byte:
Byte ist die Einheit für Binärdaten. Ein Byte ist normalerweise 8 Bit lang. Einige ältere Computerarchitekturen verwenden jedoch unterschiedliche Längen. Um Verwirrung zu vermeiden, wird in der meisten internationalen Literatur das Wort Byte anstelle von Byte verwendet. In den meisten Computersystemen ist ein Byte eine 8-Bit-Dateneinheit. Die meisten Computer verwenden ein Byte zur Darstellung eines Zeichens, einer Zahl oder eines anderen Zeichens. Ein Byte kann auch eine Reihe binärer Bits darstellen. In manchen Computersystemen stellen 4 Bytes ein Wort dar, also die Dateneinheit, die der Computer bei der Ausführung von Anweisungen effizient verarbeiten kann. Einige Sprachbeschreibungen erfordern 2 Bytes zur Darstellung eines Zeichens, was als Doppelbyte-Zeichensatz bezeichnet wird. Einige Prozessoren sind in der Lage, Doppelbyte- oder Einzelbyte-Befehle zu verarbeiten. Bytes werden oft als „B“ abgekürzt und Bits werden normalerweise als Kleinbuchstaben „b“ abgekürzt. Die Größe des Computerspeichers wird normalerweise in Bytes ausgedrückt.
Weitere Informationen zu diesem Thema finden Sie in der Spalte „FAQ“!
Das obige ist der detaillierte Inhalt vonWie viele Bytes belegt ein englischer Buchstabe in einer ASCII-Codedatei?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!