Heim >Datenbank >MySQL-Tutorial >Wie viele Bytes belegt Chinesisch in MySQL?

Wie viele Bytes belegt Chinesisch in MySQL?

青灯夜游
青灯夜游Original
2020-10-07 13:17:1811157Durchsuche

In MySQL hängt die Anzahl der von einem chinesischen Zeichen belegten Bytes mit dem Codierungsformat zusammen: Wenn es sich um eine GBK-Codierung handelt, belegt ein chinesisches Zeichen 2 Bytes, bei einer UTF8-Codierung belegt ein chinesisches Zeichen 3 Bytes belegen 1 Byte.

Wie viele Bytes belegt Chinesisch in MySQL?

Wie viele Bytes belegt Chinesisch in MySQL?

1. utf-8, englische Buchstaben 1 Byte

  • 2. Wie viele chinesische Zeichen kann varchar(n) speichern?

  • varchar(n) stellt n Zeichen dar. MySQL kann n Zeichen speichern. Nur die tatsächliche Bytelänge ist unterschiedlich.
  • 3. Wie überprüft MySQL die Länge (Anzahl der belegten Bytes)?
Die Längenfunktion in der SQL-Sprache kann verwendet werden:

select LENGTH(fieldname) from tablename

Beschreibung:

UTF-8: Unicode Transformation Format-8bit, Stückliste ist zulässig, Stückliste ist jedoch normalerweise nicht enthalten. Es handelt sich um eine Multibyte-Kodierung zur Lösung internationaler Zeichen. Sie verwendet 8 Bit (d. h. ein Byte) für Englisch und 24 Bit (drei Byte) für Chinesisch. UTF-8 enthält Zeichen, die von allen Ländern der Welt verwendet werden. Es handelt sich um eine internationale Kodierung und eine große Vielseitigkeit. UTF-8-codierter Text kann in Browsern in verschiedenen Ländern angezeigt werden, die den UTF8-Zeichensatz unterstützen. Wenn es sich beispielsweise um eine UTF8-Codierung handelt, kann Chinesisch auch im englischen IE von Ausländern angezeigt werden, und sie müssen das chinesische Sprachunterstützungspaket des IE nicht herunterladen.

GBK ist ein Standard, der auf dem nationalen Standard GB2312 basiert und erweitert wurde, um mit GB2312 kompatibel zu sein. Die Textkodierung von GBK wird durch Doppelbytes dargestellt, das heißt, sowohl chinesische als auch englische Zeichen werden durch Doppelbytes dargestellt. Um chinesische Zeichen zu unterscheiden, werden die höchsten Bits auf 1 gesetzt. GBK enthält alle chinesischen Zeichen und ist eine nationale Kodierung. Es ist weniger vielseitig als UTF8, belegt aber eine größere Datenbank als GBD.

GBK, GB2312 usw. müssen durch Unicode-Kodierung in UTF8 konvertiert werden:

GBK, GB2312-->Unicode-->UTF8

UTF8-->Unicode-->GBK, GB2312


GB2312 ist eine Teilmenge von GBK, GBK ist eine Teilmenge von GB18030

GBK ist ein großer Zeichensatz einschließlich chinesischer, japanischer und koreanischer Zeichen

Um alle verstümmelten Zeichen zu vermeiden, sollte UTF-8 übernommen werden wird in Zukunft unterstützt Internationalisierung ist auch sehr praktisch

    UTF8 kann als großer Zeichensatz angesehen werden, der die Codierung der meisten Texte enthält.
  • Ein Vorteil der Verwendung von UTF8 besteht darin, dass Benutzer in anderen Regionen (z. B. Hongkong und Taiwan) Ihren Text normal und ohne verstümmelte Zeichen anzeigen können, ohne die Unterstützung für vereinfachtes Chinesisch installieren zu müssen.
  • Zusammenfassung:

  • gb2312 ist der Code für vereinfachtes Chinesisch

    gbk unterstützt vereinfachtes Chinesisch und traditionelles Chinesisch
  • big5 unterstützt traditionelles Chinesisch

    utf8 unterstützt fast alle Zeichen

Empfohlen. Tutorial : mein SQL-Video Tutorial

Das obige ist der detaillierte Inhalt vonWie viele Bytes belegt Chinesisch in MySQL?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn