Heim >Backend-Entwicklung >C++ >Darstellung und Manipulation von Informationen in modernen Computern – Teil 2

Darstellung und Manipulation von Informationen in modernen Computern – Teil 2

Linda Hamilton
Linda HamiltonOriginal
2024-11-22 14:18:40811Durchsuche

Representing and Manipulating Information in modern computer - Part 2

Link zu Teil 1

Adressierung und Byte-Reihenfolge

Ein 4-Byte-Int in einer 32-Bit-Maschine speichert alle seine 4 Bytes in einer zusammenhängenden Bytefolge. Es kann je nach Maschine auf zwei Arten gespeichert werden, nämlich Little Endian und Big Endian. Ohne zu sehr ins Detail zu gehen, speichert Little Endian ein int(4 Bytes auf 32-Bit) mit dem Hexadezimalwert 0x01234567, etwa wie folgt (vorausgesetzt, die Startadresse ist 0x100):
Adressen/Werte
0x100 67
0x101 45
0x102 23
0x103 01
und ähnlich sieht ein Big Endian wie folgt aus:
Adressen/Werte
0x100 01
0x101 23
0x102 45
0x103 67
Ich hoffe, Sie können den Unterschied in der Reihenfolge erkennen. Linux 32bit, Windows, Linux 64bit folgt Little Endian, während SunOS/SPARC Big Endian folgt.

Dies ist wichtig, da es beim Senden einer Nachricht über ein Netzwerk von Little-Endian-Byte-Bestellmaschinen zu Big-Endian-Byte-Bestellmaschinen und umgekehrt zu Problemen kommen kann. Die meisten Programmierer sehen darin kein Problem, da Netzwerkanwendungen so geschrieben sind, dass diese Konvertierungen für uns erledigt werden. Wenn Sie jedoch eine Netzwerkanwendung schreiben, müssen Sie dies möglicherweise berücksichtigen.

Ganzzahlarithmetik

Sie werden vielleicht überrascht sein zu wissen, dass die Addition zweier positiver Zahlen zu einer negativen Zahl führen kann und x < y kann zu einem anderen Ergebnis führen als x - y < 0.

Lassen Sie mich ein Beispiel geben: Nehmen wir an, wir haben einen Computer, der ein int als 4-Bit speichert, und wir haben zwei unsigned int x und y.

unsigned int x = 10; // binärer Rep: 1010
unsigned int y = 15; // binärer Rep: 1111
unsigned int z = x y; // ???

Der Wert von z ist 25. richtig? richtig?

Naja, nein. Wenn Sie 25 in die binäre Darstellung umwandeln, ergibt sich 11001, aber wie ich bereits erwähnt habe, kann unser Computer nur 4-Bit-Ganzzahlen speichern (Werte von 0 bis 15 im Falle von vorzeichenlosen Zahlen). Was macht unser Computer also mit dem zusätzlichen 1-Bit? Sie haben Recht, es wird das höherwertige Bit (erstes Bit von links) gelöscht und wir erhalten 1001, was in 9 konvertiert wird. Dies ist dasselbe, als würde man ein Modul mit 16 machen, also 25 mod 16=9. Dieses Verhalten des Computers, das nicht auf die Arithmetik beschränkt ist, wird auch Überlauf genannt.

Aber warum verwende ich hier unsigned int? Verhält sich dieser Zusatz bei vorzeichenbehafteten Ganzzahlen anders?

Antwort: Ja, aber bevor wir erklären, was das Ergebnis sein wird und wie unser Computer dazu gekommen ist, wollen wir zunächst verstehen, wie sich Vorzeichen und Vorzeichen bei unserer 4-Bit-Ganzzahl unterscheiden.

ganze Zahlen mit Vorzeichen

Sie können sowohl positive als auch negative Zahlenwerte von -8 (Bin-Rep: 1000) bis 7 (Bin-Rep: 0111) speichern. Das höherwertige Bit (erstes Bit von links) ist dasjenige, das vorzeichenbehaftete ganzzahlige negative Werte liefert und die restlichen Bits positive Werte ergeben. Um also die kleinste Zahl zu erhalten, müssen wir höherwertige Bits auf 1 und andere Bits auf 0 umdrehen, und um die größte Zahl zu erhalten, müssen wir höherwertige Bits auf 0 und andere Bits auf 1 umdrehen.

vorzeichenlose ganze Zahlen

Sie können nur positive Zahlenwerte von 0 (Binärdarstellung: 0000) bis 15 (Binärdarstellung: 1111) speichern.

Da nun x=10 und y=15 vor der Addition überlaufen, verwenden wir etwas Kleineres:
int x = 5; // 0101
int y = 6; // 0110
int z = x y // ???

Die binäre Darstellung sollte 1011 sein, wenn wir die Vorzeichenberücksichtigung ignorieren. Wie Sie sehen können, wird das höherwertige Bit auf 1 umgedreht und von oben betrachtet beträgt der Wert von z -5 (= -1*2ˆ3 2ˆ1 2ˆ0) statt 11.

Und auch das Hinzufügen von zwei Negativen kann zu einem Positiv führen. zB
int x = -8 // 1000
int y = -5 // 0101
int z = x y // ???

Jetzt ist z -13, was binär 10011 ist (das höherwertige Bit ist für Negative, z. B. -1*2ˆ4 = -16), aber unser Computer kann nur 4 Bits speichern, sodass er das höherwertige Bit und löscht wird zu 0011, also 3 im Dezimalformat. Wieder Überlauf.

Deshalb ist x < y könnte sich von x unterscheiden - y < 0, wenn wir arthmetische Überläufe nicht richtig behandeln. Als Programmierer sollten wir bei der Auswahl von Datentypen immer darauf achten, deren Kapazitäten und Verhalten in verschiedenen Situationen zu berücksichtigen, da diese möglicherweise das Ergebnis stundenlangen Debuggens sind.

Das ist alles für heute. Bitte kommentieren Sie es aus, wenn hier Informationen falsch sind oder fehlen. Vielen Dank.

Das obige ist der detaillierte Inhalt vonDarstellung und Manipulation von Informationen in modernen Computern – Teil 2. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn