Der Unicode-Zeichensatz verwendet mehrere Bytes zur Darstellung eines Zeichens-häufiges Problem-php.cn

Heim

häufiges Problem

Der Unicode-Zeichensatz verwendet mehrere Bytes zur Darstellung eines Zeichens

青灯夜游

May 07, 2021 pm 04:43 PM

unicode字符字符集字节

Der Unicode-Zeichensatz verwendet 2 Bytes zur Darstellung eines Zeichens. Unicode legt eine einheitliche und eindeutige Binärkodierung für jedes Zeichen in jeder Sprache fest, um die Anforderungen für die sprach- und plattformübergreifende Textkonvertierung und -verarbeitung zu erfüllen. Mit der 2-Byte-Kodierung können alle Texte auf der Welt vereinheitlicht werden.

Der Unicode-Zeichensatz verwendet mehrere Bytes zur Darstellung eines Zeichens

Die Betriebsumgebung dieses Tutorials: Windows 7-System, Dell G3-Computer.

Der Unicode-Zeichensatz verwendet 2 Bytes zur Darstellung eines Zeichens.

Unicode (Unicode, Universal Code, Unicode) ist eine Zeichenkodierung, die auf Computern verwendet wird. Es legt eine einheitliche und eindeutige Binärcodierung für jedes Zeichen in jeder Sprache fest, um die Anforderungen für die sprach- und plattformübergreifende Textkonvertierung und -verarbeitung zu erfüllen.

Wenn verschiedene Textkodierungen als Dialekte verschiedener Orte beschrieben werden, dann ist Unicode eine Sprache, die von Ländern auf der ganzen Welt gemeinsam entwickelt wurde.

In dieser Sprachumgebung gibt es keine Sprachkodierungskonflikte mehr. Inhalte können in jeder Sprache auf demselben Bildschirm angezeigt werden. Das bedeutet, dass der gesamte Text der Welt einheitlich mit 2 Bytes kodiert ist. Auf diese Weise reichen bei einer einheitlichen Codierung wie dieser 2 Bytes aus, um den größten Teil des Textes in allen Sprachen der Welt unterzubringen.

Der wissenschaftliche Name von Unicode ist „Universal Multiple-Octet Coded Character Set“, auch UCS genannt.

Die frühen Unicode-Standards hießen UCS-2 und UCS-4. UCS-2 ist mit zwei Bytes kodiert und UCS-4 ist mit 4 Bytes kodiert. Derzeit wird UCS-2 verwendet, eine 2-Byte-Kodierung, und UCS-4 wurde entwickelt, um zu verhindern, dass 2 Bytes in Zukunft nicht mehr ausreichen.

UCS-4 ist basierend auf dem höchsten Byte in 2^7=128 Gruppen unterteilt, wobei das höchste Bit 0 ist. Jede Gruppe ist entsprechend dem nächsthöheren Byte in 256 Ebenen unterteilt. Jede Ebene ist entsprechend dem dritten Byte in 256 Zeilen unterteilt, und jede Zeile verfügt über 256 Codepunkte (Zellen). Ebene 0 der Gruppe 0 heißt BMP (Basic Multilingual Plane). UCS-2 wird durch Entfernen der ersten beiden Nullbytes des BMP von UCS-4 erhalten.

Weitere Informationen zu diesem Thema finden Sie in der Spalte „FAQ“!

Das obige ist der detaillierte Inhalt vonDer Unicode-Zeichensatz verwendet mehrere Bytes zur Darstellung eines Zeichens. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Beste grafische Einstellungen

3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Seashell Riddle -Lösung

2 Wochen vorByDDD

R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können

3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Wie man alles in Myrise freischaltet

4 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

MinGW – Minimalistisches GNU für Windows

Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

WebStorm-Mac-Version

Nützliche JavaScript-Entwicklungstools

SecLists

SecLists ist der ultimative Begleiter für Sicherheitstester. Dabei handelt es sich um eine Sammlung verschiedener Arten von Listen, die häufig bei Sicherheitsbewertungen verwendet werden, an einem Ort. SecLists trägt dazu bei, Sicherheitstests effizienter und produktiver zu gestalten, indem es bequem alle Listen bereitstellt, die ein Sicherheitstester benötigen könnte. Zu den Listentypen gehören Benutzernamen, Passwörter, URLs, Fuzzing-Payloads, Muster für vertrauliche Daten, Web-Shells und mehr. Der Tester kann dieses Repository einfach auf einen neuen Testcomputer übertragen und hat dann Zugriff auf alle Arten von Listen, die er benötigt.

Dreamweaver Mac

Visuelle Webentwicklungstools

Sicherer Prüfungsbrowser

Safe Exam Browser ist eine sichere Browserumgebung für die sichere Teilnahme an Online-Prüfungen. Diese Software verwandelt jeden Computer in einen sicheren Arbeitsplatz. Es kontrolliert den Zugriff auf alle Dienstprogramme und verhindert, dass Schüler nicht autorisierte Ressourcen nutzen.

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7476

CakePHP-Tutorial

1377

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

NYT -Verbindungen Hinweise und Antworten