Heim >Backend-Entwicklung >C++ >Darstellung und Manipulation von Informationen in modernen Computern – Teil 1
Wie die meisten von Ihnen vielleicht bereits wissen, kann der Computer nur ein Bit (0 und 1) verstehen, speichern und verarbeiten.
Aber warum?
Nun, es stellt sich heraus, dass zweiwertige Signale einfacher und zuverlässiger dargestellt, gespeichert und übertragen werden können als die herkömmliche Darstellung von Zahlen zur Basis 10 – zum Beispiel als Vorhandensein oder Fehlen eines Lochs in einer Lochkarte, als Hoch oder Tief Spannung an einem Draht oder als magnetische Domäne, die im oder gegen den Uhrzeigersinn ausgerichtet ist usw.
Darüber hinaus ist ein einzelnes Bit normalerweise nicht sehr hilfreich, um etwas Sinnvolles im Computer darzustellen, aber sobald wir eine Folge von Bits kombinieren, können wir jede endliche Menge darstellen. Beispielsweise können wir Bits in negative/nichtnegative und Gleitkommazahlen kodieren und auch die Buchstaben und Symbole in einem Dokument kodieren. Aus diesem Grund (oder vielleicht auch nicht) verwenden wir 8 Bit oder ein Byte als kleinste adressierbare Speichereinheit. In binärer Schreibweise reicht sein Wert von 00000000 bis 11111111. Als dezimale Ganzzahl betrachtet liegt sein Wert zwischen 0 und 255 und in hexadezimaler Darstellung zwischen 00 und FF. Normalerweise schreiben wir Bitmuster als Hexadezimalzahlen (0 - 9, A - F), da es für uns einfach ist, sie in/von binären Notationen umzuwandeln.
In der Programmiersprache C werden numerische Konstanten, die mit 0x oder 0X beginnen, als hexadezimal interpretiert. Die Zeichen „A“ bis „F“ können entweder in Groß- oder Kleinbuchstaben geschrieben werden. Zum Beispiel könnten wir die Zahl FA1D37B als 0xFA1D37B, als 0xfa1d37b schreiben oder sogar Groß- und Kleinbuchstaben mischen (z. B. 0xFa1D37b).
Okay, lasst uns noch etwas besprechen,
Einige CS-Begriffe voraus!!!
Virtueller Speicher – Ein konzeptionelles großes Array von Bytes im Speicher (es steckt noch mehr dahinter, aber es kommt später in der Serie)
Speicheradresse – Eine eindeutige Nummer, die zur Identifizierung eines Bytes im Speicher verwendet wird.
Virtueller Speicherplatz – Die Menge aller möglichen Speicheradressen (mehr folgt später).
Wortgröße – Die nominale Größe der Zeigerdaten oder die maximale Größe der virtuellen Speicheradresse.
Heutige Computer haben entweder eine 32-Bit- oder eine 64-Bit-Wortgröße, was bedeutet, dass Programme auf einen Bereich von 0 bis 2^32 - 1 (bei 32-Bit) und 0 bis 2^64 - 1 (bei 32-Bit) zugreifen können 64-Bit) virtueller Adressen. Die meisten Programme, die auf 64-Bit-Maschinen kompiliert wurden, können auch auf 32-Bit-Maschinen ausgeführt werden, aber umgekehrt ist das nicht der Fall.
Computer und Compiler unterstützen mehrere Datenformate mit unterschiedlichen Arten der Datenkodierung, wie z. B. Ganzzahlen und Gleitkommazahlen, sowie unterschiedlichen Längen. Viele Maschinen verfügen beispielsweise über Anweisungen zum Bearbeiten einzelner Bytes sowie von Ganzzahlen, die als 2-, 4- und 8-Byte-Größen dargestellt werden. Sie unterstützen auch Gleitkommazahlen, die als 4- und 8-Byte-Größen dargestellt werden. Die genaue Anzahl der Bytes für einige Datentypen hängt davon ab, wie das Programm kompiliert wird. Unten habe ich Größen für typische 32-Bit- und 64-Bit-Programme gezeigt:
Um Verwechslungen zwischen der Bitzahl der Maschine und den Compilereinstellungen zu vermeiden, hat ISO C99 einige Datentypen eingeführt, bei denen die Datengrößen unabhängig von den Compiler- oder Maschineneinstellungen festgelegt sind. Wie Sie im obigen Screenshot sehen können, gehören int32_t und int64_t dazu. Die Verwendung von Integer-Typen fester Größe ist für Programmierer die beste Möglichkeit, eine genaue Kontrolle über die Datendarstellungen zu haben.
Bevor wir uns abmelden: Wir sollten versuchen, Code zu schreiben, der auf verschiedene Maschinen und Compiler portierbar ist. Ein Aspekt der Portabilität besteht darin, das Programm unempfindlich gegenüber den genauen Größen der verschiedenen Datentypen zu machen. Mit dem Übergang zu 64-Bit-Maschinen sind viele versteckte Wortgrößenabhängigkeiten als Fehler bei der Migration von 32-Bit-Programmen auf neue Maschinen aufgetreten. Beispielsweise gingen viele Programmierer in der Vergangenheit davon aus, dass ein als Typ int deklariertes Objekt zum Speichern eines Zeigers verwendet werden könnte. Dies funktioniert für die meisten 32-Bit-Programme gut, führt jedoch bei 64-Bit-Programmen zu Problemen, da, wie oben erläutert, die Wortgröße oder Zeigergröße von 32-Bit- und 64-Bit-Maschinen unterschiedlich sein wird.
Okay. das ist alles für heute. Vielen Dank.
Ref: Computersysteme: Die Perspektive eines Programmierers.
Das obige ist der detaillierte Inhalt vonDarstellung und Manipulation von Informationen in modernen Computern – Teil 1. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!