Heim  >  Artikel  >  Backend-Entwicklung  >  Was ist die Speicherform von Zeichendaten im Speicher?

Was ist die Speicherform von Zeichendaten im Speicher?

青灯夜游
青灯夜游Original
2021-06-03 11:57:2725738Durchsuche

Zeichendaten werden im ASCII-Code im Speicher gespeichert. Bei Zeichendaten wird eine Zeichenkonstante in eine Zeichenvariable eingefügt. Dabei wird nicht das Zeichen selbst in die Speichereinheit eingefügt, sondern der entsprechende ASCII-Code des Zeichens in die Speichereinheit.

Was ist die Speicherform von Zeichendaten im Speicher?

Die Betriebsumgebung dieses Tutorials: Windows 7-System, c99-Version, Dell G3-Computer.

Zeichendaten werden im Speicher als ASCII-Codewert gespeichert, der ein Byte ist. Alle Datentypen werden im Speicher als Binärcodes von 0 und 1 gespeichert. Dieses Prinzip ändert sich nicht.

In der C-Sprache besteht der Typ char darin, eine Zeichenkonstante in eine Zeichenvariable einzufügen. Dabei wird nicht das Zeichen selbst in die Speichereinheit eingefügt, sondern der entsprechende ASCII-Code des Zeichens.

Bei der Codierung benötigt ein chinesischer Zeichenspeicher 2 Bytes. Bei der UTF-8-Codierung erfordert die Speicherung eines englischen alphabetischen Zeichens 1 Byte und die Speicherung eines chinesischen Zeichens 3 bis 4 Byte. Bei der UTF-16-Kodierung erfordert die Speicherung eines englischen alphabetischen Zeichens oder eines chinesischen Zeichens 2 Bytes. Bei der UTF-32-Kodierung erfordert die Speicherung eines beliebigen Zeichens auf der Welt 4 Bytes.

Was ist die Speicherform von Zeichendaten im Speicher?

Erweiterte Informationen:

ASCII ((American Standard Code for Information Interchange): American Standard Code for Information Interchange) ist ein Computercodierungssystem, das auf dem lateinischen Alphabet basiert und hauptsächlich zur Darstellung von modernem Englisch und anderen westeuropäischen Sprachen verwendet wird . Es ist der am weitesten verbreitete Standard für den Informationsaustausch und entspricht dem internationalen Standard ISO/IEC 646. ASCII wurde erstmals 1967 als standardisierter Typ veröffentlicht, die letzte Aktualisierung erfolgte 1986. Bisher wurden insgesamt 128 Zeichen durch spezifizierte 7-Bit- oder 8-Bit-Binärzahlenkombinationen definiert 256 mögliche Zeichen. Standard-ASCII-Code, auch Basis-ASCII-Code genannt, verwendet 7 Binärziffern (die verbleibende 1 Binärziffer ist 0), um alle Groß- und Kleinbuchstaben, Zahlen 0 bis 9, Satzzeichen und spezielle Steuerelemente darzustellen, die im amerikanischen Englisch verwendet werden. Zeichen [1] . Darunter:

0~31 und 127 (insgesamt 33) sind Steuerzeichen oder kommunikationsspezifische Zeichen (der Rest sind anzeigbare Zeichen), wie z. B. Steuerzeichen: LF (Zeilenvorschub), CR (Wagenrücklauf), FF ( Seitenvorschub), DEL (Löschen), BS (Rücktaste), BEL (Ring) usw.; Kommunikationssonderzeichen: SOH (Textkopf), EOT (Textende), ASCII-Werte ​​sind 8, 9, 10 und 13. Konvertieren Sie sie jeweils in Rückschritt-, Tabulator-, Zeilenvorschub- und Wagenrücklaufzeichen. Sie verfügen nicht über eine spezielle grafische Darstellung, haben jedoch je nach Anwendung unterschiedliche Auswirkungen auf die Textdarstellung [1].

32~126 (insgesamt 95) sind Zeichen (32 ist ein Leerzeichen), davon sind 48~57 zehn arabische Ziffern von 0 bis 9.

65~90 sind 26 englische Großbuchstaben, 97~122 sind 26 englische Kleinbuchstaben und der Rest sind einige Satzzeichen, Rechenzeichen usw.

Beachten Sie außerdem, dass im Standard-ASCII das höchste Bit (b7) als Paritätsbit verwendet wird. Die sogenannte Paritätsprüfung bezeichnet eine Methode zur Überprüfung, ob bei der Codeübertragung Fehler auftreten. Sie wird im Allgemeinen in zwei Arten unterteilt: die ungerade Prüfung und die gerade Prüfung. Regeln für ungerade Parität: Die Anzahl der Einsen in einem Byte des korrekten Codes muss eine ungerade Zahl sein. Wenn es sich nicht um eine ungerade Zahl handelt, addieren Sie 1 zum höchsten Bit. b7 Regeln für gerade Parität: Die Anzahl der Einsen in einem Byte des Der korrekte Code muss eine gerade Zahl sein. Wenn es sich nicht um eine gerade Zahl handelt, addieren Sie 1 [1] zum höchsten Bit b7.

Die letzten 128 werden als erweiterte ASCII-Codes bezeichnet. Viele x86-basierte Systeme unterstützen die Verwendung von erweitertem (oder „hohem“) ASCII. Erweitertes ASCII ermöglicht die Verwendung des 8. Bits jedes Zeichens zur Bestimmung zusätzlicher 128 Sonderzeichen, Fremdbuchstaben und Grafiksymbole.

Verwandte Empfehlungen: „

C-Sprachvideo-Tutorial

Das obige ist der detaillierte Inhalt vonWas ist die Speicherform von Zeichendaten im Speicher?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn