Heim > Artikel > Backend-Entwicklung > Welche Beziehung besteht zwischen Unicode und UTF-8, ISO8859-1 usw.?
Was ist zunächst einmal die Beziehung zwischen diesen beiden? Welche Beziehung besteht außerdem zwischen Codierung und Implementierung? Ich verstehe diese Konzepte nicht = =
Was ist zunächst einmal die Beziehung zwischen diesen beiden? Welche Beziehung besteht außerdem zwischen Codierung und Implementierung? Ich verstehe diese Konzepte nicht = =
Jemand hat diese Frage noch einmal gestellt, also musste ich den Link posten.
https://segmentfault.com/q/1010000004240543/a-1020000004241029
http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html
Vielen Dank, Ruanyifeng, für Ihren Blogbeitrag http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html
Zusammenfassend lässt sich sagen, dass der Unterschied wahrscheinlich darin besteht, dass Unicode nur ein Symbolsatz ist. Er gibt nur den Binärcode des Symbols an, legt jedoch nicht fest, wie der Binärcode gespeichert werden soll. UTF-8 usw. sind die Namen der Speichermethoden von Zeichensätzen. Das eine ist der Symbolsatz und das andere die Speichermethode. Das ist der Unterschied.
ANSI und Unicode sind zwei verschiedene Standardsysteme zur Darstellung von Zeichen.
ISO8859-1 und GBK sind alle von ANSI abgeleitet. Diese Art der Kodierung ist ein für einen bestimmten Texttyp etablierter Standard und im Allgemeinen nur mit ASCII kompatibel.
UTF-8 und UTF-16 sind Unicode-Standardkodierungen, die alle Sprachen und Zeichen der Welt umfassen, sodass der Text auf Computern in verschiedenen Sprachumgebungen ohne verstümmelte Zeichen dieses Typs angezeigt werden kann Der Grund für die Codierung liegt darin, dass sie viele Zeichen enthält und daher relativ mehr Platz einnimmt.
Kurz gesagt, die Essenz dessen, womit wir häufig in Kontakt kommen, ist UTF-8, eine Art Unicode-Verpackung. Daher muss die Konvertierung zwischen Codierungen zuerst in Unicode und dann konvertiert werden.