Heim >Java >JavaErste Schritte >Was ist der Unterschied zwischen Java-Zeichen und Bytes?

Was ist der Unterschied zwischen Java-Zeichen und Bytes?

爱喝马黛茶的安东尼
爱喝马黛茶的安东尼Original
2019-11-12 15:24:473484Durchsuche

Was ist der Unterschied zwischen Java-Zeichen und Bytes?

Byte bedeutet Byte. Es wird zum Deklarieren von Byte-Variablen verwendet. Daher ist der Byte-Typ der Wertebereich ist -128 bis 127.

Normalerweise müssen Sie beim Lesen von Nicht-Textdateien (z. B. Bildern, Sounds, ausführbaren Dateien) Byte-Arrays verwenden, um den Inhalt der Dateien zu speichern. Beim Herunterladen von Dateien werden Byte-Arrays auch als temporärer Puffer verwendet Empfang. Dateiinhalt. Daher ist Byte bei Dateioperationen von wesentlicher Bedeutung. Es wird sowohl beim Schreiben als auch beim Lesen von Dateien verwendet.

In einigen Programmen (insbesondere solchen, die sich auf Hardware beziehen) werden bestimmte Daten in Variablen vom Typ Byte gespeichert, z. B. 00110010, wobei jedes Bit einen Parameter darstellt und dann Werterfassungs- und Zuweisungsvorgänge durchführt Parameter mithilfe von Bitoperationen.

Die Maschine kennt nur Bytes, aber Zeichen sind semantische Einheiten. Sie können in 1, 2 oder sogar 3 bis 4 Bytes codiert werden. Dies hängt mit der Zeichensatzkodierung zusammen. Englische Buchstaben und Zahlen sind Einzelbyte-Zeichen, aber Zeichen in natürlichen Sprachen wie chinesischen Zeichen sind Mehrbyte-Zeichen. Ein Byte kann nur 255 Zeichen darstellen und kann nicht zur Verarbeitung so vieler natürlicher Sprachen auf der ganzen Welt verwendet werden, sodass auf jeden Fall ein Multibyte-Speicher erforderlich ist.

Bei der Eingabe und Ausgabe von Dateien verarbeiten InputStream und OutputStream also Byteströme, was bedeutet, dass davon ausgegangen wird, dass alles Binärbytes sind, während Reader und Writer Zeichenströme sind, was Zeichensatzprobleme mit sich bringt ; Gemäß dem ANSI-Codierungsstandard belegen Satzzeichen, Zahlen sowie Groß- und Kleinbuchstaben jeweils ein Byte und chinesische Zeichen belegen 2 Bytes. Gemäß dem UNICODE-Standard belegen alle Zeichen 2 Bytes.

Byte:

1, Bit=1, Binärdaten 0 oder 1.

2. Byte = 8 Bit, 1 Byte entspricht 8 Bits. Die Grundmaßeinheit für Speicherplatz.

3. Ein englischer Buchstabe = 1 Byte = 8 Bit. 1 englischer Buchstabe ist 1 Byte, also 8 Bit.

4. Ein chinesisches Zeichen = 2 Byte = 16 Bit. Ein chinesisches Zeichen besteht aus zwei Bytes, also 16 Bit.

Zeichen:

Java verwendet Unicode zur Darstellung von Zeichen. Ein Zeichen in Java ist 2 Bytes groß, und die Unicode-Kodierung eines chinesischen oder englischen Zeichens nimmt 2 Bytes ein. Die Anzahl der von einem Zeichen belegten Bytes variiert jedoch je nach anderen Kodierungen.

Bei der GB 2312-Kodierung oder GBK-Kodierung erfordert die Speicherung eines englischen alphabetischen Zeichens 1 Byte und die Speicherung eines chinesischen Zeichens 2 Byte.

Bei der UTF-8-Kodierung erfordert die Speicherung eines englischen alphabetischen Zeichens 1 Byte und die Speicherung eines chinesischen Zeichens 3 bis 4 Byte.

Bei der UTF-16-Codierung erfordert die Speicherung eines englischen alphabetischen Zeichens 2 Bytes und die Speicherung eines chinesischen Zeichens 3 bis 4 Bytes (einige chinesische Zeichen im Unicode-Erweiterungsbereich erfordern 4 Zeichen). Festival zu speichern).

Bei der UTF-32-Kodierung erfordert die Speicherung eines beliebigen Zeichens auf der Welt 4 Bytes.

php Chinesische Website, eine große Anzahl kostenloser Java-Einführungs-Tutorials, willkommen zum Online-Lernen!

Das obige ist der detaillierte Inhalt vonWas ist der Unterschied zwischen Java-Zeichen und Bytes?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn