Heim >Datenbank >MySQL-Tutorial >Lösung für das Problem, dass Emoji-Ausdrücke nicht in MySQL eingefügt werden konnten

Lösung für das Problem, dass Emoji-Ausdrücke nicht in MySQL eingefügt werden konnten

巴扎黑
巴扎黑Original
2017-05-14 14:20:051791Durchsuche

Emoji-Ausdrücke kommen in unserer täglichen Entwicklung häufig vor, aber kürzlich bin ich auf ein Problem beim Einfügen von Emoji-Ausdrücken in MySQL gestoßen. Ich habe es schließlich durch die Suche nach relevanten Informationen gelöst, daher werde ich in diesem Artikel hauptsächlich den Prozess zur Lösung dieses Problems vorstellen Ich werde Ihnen die Lösung für das Problem vorstellen, dass MySQL keine Emoji-Ausdrücke einfügt. Freunde in Not können sich darauf beziehen.

Vorwort

Ich dachte immer, dass UTF-8 eine universelle Lösung für Zeichensatzprobleme sei, bis ich kürzlich auf dieses Problem stieß. Kürzlich habe ich an einem Crawler für Sina Weibo gearbeitet. Beim Speichern habe ich festgestellt, dass die folgende Ausnahme ausgelöst wird, solange ich den Emoji-Ausdruck behalte:


Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...'

Das bekannte UTF -8 ist 3 Byte groß, was bereits die meisten Schriftarten enthält, die wir jeden Tag sehen. Aber 3 Byte reichen bei weitem nicht aus, um den gesamten Text aufzunehmen, also gibt es utf8mb4, eine Obermenge von utf8 , was 4 Bytes entspricht, abwärtskompatibel mit utf8. Die Emoji-Ausdrücke, die wir täglich verwenden, sind

Wenn wir also Daten in die utf8-Datentabelle einfügen, wird dieser Fehler gemeldet .Incorrect string value

Die Lösung ist einfach über Google zu finden:


Ändern Sie den Zeichensatz der Daten Tabelle Es ist sehr einfach, utf8mb4 zu ändern

Sie können viele Änderungsanweisungen online finden, es wird jedoch empfohlen, die Tabelle neu zu erstellen und mit

zu sichern die entsprechende Datentabelle und ändern Sie den Zeichensatz der Tabellenanweisung, und importieren Sie dann SQL erneut, um den Zeichensatzänderungsvorgang abzuschließen 🎜> 2. Die MySQL-Datenbankversion muss 5.5.3 und höher sein. Das Obige mysqldump -uusername -ppassword database_name table_name > table.sqlmysql -uusername -ppassword database_name < table.sql

Alle Artikel im Internet weisen darauf hin, dass MySQL 5.5.3 oder höher erforderlich ist, um utf8mb4 zu unterstützen Die von mir verwendete Datenbankversion ist jedoch 5.5.18 und kann am Ende immer noch gelöst werden. Daher sollten die Schüler nicht zuerst zum Betriebs- und Wartungsbruder eilen, um die Datenbank zu aktualisieren Beheben Sie das Problem selbst.
3. Ändern Sie die Datenbankkonfigurationsdatei /etc/my .cnf und starten Sie den MySQL-Dienst neu


Hauptsächlich zum Ändern des Standardzeichensatzes der Datenbank sowie des Verbindungs- und Abfragezeichensatzes. [Mysql unterstützt Emoji und die Emoticon-Upgrade-Codierung ist UTF8MB4][1] Dieser Artikel enthält detaillierte Einstellungsmethoden, [Ausführlich MySQL-Zeichensatzeinstellung][2] In diesem Artikel wird die Rolle jedes Zeichensatzes beschrieben. Sie können mehr darüber erfahren.
4. Aktualisieren Sie MySQL Connector auf 5.1. 21 und höher


Für alle oben genannten Vorgänge ist der kritischste Schritt 3, das Ändern der Datenbankkonfigurationsdatei, bei dem es sich um Geändert

Diese Konfigurationen geben den Zeichensatz an, der von den Pipes verwendet wird, die die Daten vom Client an den Server weiterleiten, wo jede Pipe auftritt. Probleme können zu Einfügungsfehlern oder verstümmelten Zeichen führen


Aber Online-Datenbanken können Datenbankdateien oft nicht beiläufig ändern, daher haben mich unsere Klassenkameraden für Betrieb und Wartung entschieden abgelehnt, die Datenbankkonfiguration (T_T) zu ändern.


Das ist möglich kann nur mit Code gelöst werden. Der erste Schritt besteht darin, mit dem beim Herstellen einer Verbindung zu JDBC angegebenen Zeichensatz zu beginnen.

[client]
# 客户端来源数据的默认字符集
default-character-set = utf8mb4
[mysqld]
# 服务端默认字符集
character-set-server=utf8mb4
# 连接层默认字符集
collation-server=utf8mb4_unicode_ci
[mysql]
# 数据库默认字符集
default-character-set = utf8mb4



Hauptsächlich UTF-8 in utf8mb4 ändern für Java Style Charset Strings sollten das Problem lösen, oder?


Aber leider verfügt Java JDBC nicht über einen Zeichensatz für utf8mb4. Bei Verwendung von UTF-8 kann es mit urf8mb4 kompatibel sein und automatisch konvertiert werden den Zeichensatz.


Um beispielsweise 4-Byte-UTF-8-Zeichensätze mit Connector/J zu verwenden, konfigurieren Sie den MySQL-Server mit „character_set_server=utf8mb4“ und lassen Sie „characterEncoding“ aus der Connector/J-Verbindung heraus string. Connector/J erkennt dann automatisch die UTF-8-Einstellung – [MySQL:Verwenden von Zeichensätzen und Unicode] Sie können den zu verwendenden Zeichensatz explizit angeben. Geben Sie mit

an, dass der Zeichensatz dieses Links utf8mb4 ist. Diese Einstellung ist jedoch jedes Mal erforderlich. Die Verbindung wird ungültig 🎜>Die aktuelle Lösung besteht darin,
jdbc:mysql://localhost:3306/ding?characterEncoding=UTF-8
explizit aufzurufen und auszuführen, wenn Sie utf8mb4 einfügen müssen, wie zum Beispiel:



Es sollte beachtet werden Wenn wir das ORM-Framework verwenden, verzögert das Framework aus Gründen der Leistungsoptimierung die Übermittlung, es sei denn, die Transaktion endet oder der Benutzer ruft aktiv die erzwungene Übermittlung auf, und die für die Ausführung verantwortliche Person
Wird immer noch nicht wirksam.

set names utf8mb4 Hier verwende ich myBatis und nehme MessageDao als Beispiel

set names utf8mb4

An diesem Punkt ist das Problem gelöst...

jdbcTemplate.execute("set names utf8mb4");
jdbcTempalte.execute("...");
Hey, es wäre großartig, wenn die Dinge so reibungslos laufen könnten. Im Projekt ist mybatis eine Instanz und wird von Spring verwaltet, was bedeutet, dass ich keine sqlSession erhalten kann Aufgrund der Einschränkungen des Spring-Transaktionsframeworks können Benutzer die erzwungene Übermittlung nicht explizit aufrufen.

set names utf8mb4

Es gibt zwei Lösungen:


  • Wenn es bei Verwendung von AOP möglich ist, 4-Byte-UTF8-Zeichen einzufügen, wird die Präfixmethode ausgeführt set names utf8mb4, aber diese Lösung kann noch nicht bestimmen, ob die AOP-Methode von Spring für Transaktionen verwaltet wird Verwaltung, und prüfen Sie in der Front-End-Methode, ob der erhaltene Link dieselbe Sitzung ist wie das als nächstes erhaltene Verbindungsobjekt.

  • Untersuchen Sie die Erstellungsmethode von Spring JDBC und schreiben Sie einen Hook Um jedes Mal eine neue zu erstellen, führen Sie set names utf8mb4 einmal aus, um sicherzustellen, dass der Zeichensatz für jeden erhaltenen Link

festgelegt wurde

Das obige ist der detaillierte Inhalt vonLösung für das Problem, dass Emoji-Ausdrücke nicht in MySQL eingefügt werden konnten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn