Webentwicklung beinhaltet häufig die Dateninteraktion zwischen Front-End-Webseiten – PHP – MySQL. Wenn die Daten nur auf Englisch vorliegen, ist dies normalerweise nicht der Fall. Gibt es ein Problem, aber wenn es um Chinesisch geht, ist die Zeichenkodierung an den drei Stellen inkonsistent (z. B. wenn die Webseite GBK und MySQL UTF-8 verwendet). , es kann zu verstümmelten Zeichen führen
(Hinweis: Bezüglich der Zeichenkodierung. Weitere Informationen finden Sie in der Baidu-Enzyklopädie: http://baike.baidu.com/view/1204863.htm?fr=aladdin)
Front-End-Webseite Kodierung:
Normalerweise denken wir alle, dass wir das < in den
-Tag-Elementen übergeben können (wie ), um die Zeichenkodierung der gesamten Seite festzulegen. Die meisten Seiten können diese Methode verwenden, um dem Browser mitzuteilen, welche Kodierung verwendet wird, wenn der Browser diese Seite anzeigt, aber manchmal stellen wir fest, dass dieser Satz immer noch nicht funktioniert. Unabhängig davon, um welches xxx es sich handelt, verwendet der Browser immer die gleiche Codierung.Diese Situation betrifft den Header-Teil der Protokollkommunikation. Wenn ein Benutzer eine Webseite durchsucht, enthält er nicht nur den vom Server gesendeten Inhalt Unsere Webseite (einschließlich Codeinhalten wie HTML/CSS/JS), enthält aber auch den sogenannten Header (Header), der den Client über die Art der zu empfangenden Daten informiert (ob HTML, einfacher Text, Multimediadateien usw.), Größe, Quelle und andere Informationen (wenn Sie diese Informationen sehen möchten, können Sie das Telnet-Tool verwenden (Anstatt den Browser zu verwenden, versuchen Sie, Get-Anfragen selbst gemäß dem http-Protokoll zu initiieren.) Seit dem Header Wird vor dem HTML gesendet, ist ebenfalls eine niedrigere Priorität als der Header. Eine Beschreibung der Zeichenkodierung der Webseite wird ebenfalls eingefügt Analysieren Sie die Webseite schließlich gemäß dem im Header angegebenen Zeichenkodierungssatz.
In PHP können Sie header("content-type:text/html; charset=xxx. ") verwenden, um den Header über den Zeichensatz zu senden .
Für den Apache-Server gibt es eine AddDefaultCharset-Funktion, was bedeutet, dass der entsprechende Header gemäß dem Standardzeichensatz des Servers für jede gesendete Webseite festgelegt wird.
Überprüfen Sie /etc/apache2/httpd.conf (vor 2.4). ) oder /etc/apache2/conf-available/charset.conf (2.4 und höher) Es gibt einen Satz AddDefaultCharset xxx. Wenn dieser Satz nicht kommentiert ist, dann für jeden Die Funktion zum Hinzufügen eines Standardzeichensatz-Headers zu einer Webseite Zu diesem Zeitpunkt hat das Festlegen des Zeichensatzes im keine Auswirkung.
Hinweis: Die auf der HTML-Seite angegebene Codierungsmethode sollte mit der Codierungsmethode übereinstimmen, die zum tatsächlichen Speichern der HTML-Seite (eigentlich einfacher Text) verwendet wird.
Um mit Chinesisch und noch mehr anderen Sprachen kompatibel zu sein, ist die Verwendung der UTF-8-Kodierung im Allgemeinen die problemloseste Möglichkeit, da UTF-8 fast alle häufig verwendeten Sprachen der Welt unterstützt.
MySQL-Datenbankkodierung:
Geben Sie im Terminal mysql -uusername -ppassword ein und geben Sie dann das MySQL-Steuerungsprogramm ein. Geben Sie dann show-Variablen wie „character%“ ein (beachten Sie, dass bei der Eingabe von Befehlsanweisungen oder kein Semikolon vorhanden ist). SQL-Anweisungen in das MySQL-Terminal) können weggelassen werden) Sie können ein Bild ähnlich dem folgenden sehen:
Oben sind die von MySQL auf verschiedenen Ebenen verwendeten Zeichensätze aufgeführt, darunter (*)
Zeichensatz- server/default-character-set: Server-Zeichensatz, standardmäßig verwendet.
character-set-database: Datenbankzeichensatz.
character-set-table: Zeichensatz der Datenbanktabelle.
Priorität erhöht sich nacheinander. Daher müssen Sie beim Erstellen von Datenbanken und Tabellen im Allgemeinen nur den Zeichensatzserver festlegen und keinen Zeichensatz angeben. Auf diese Weise wird der Zeichensatzserver einheitlich verwendet.
character-set-client: Zeichensatz des Clients. Standardzeichensatz des Clients. Wenn ein Client eine Anfrage an den Server sendet, wird die Anfrage in diesem Zeichensatz codiert.
character-set-results: Ergebniszeichensatz. Wenn der Server Ergebnisse oder Informationen an den Client zurückgibt, werden die Ergebnisse in diesem Zeichensatz codiert.
Wenn auf der Client-Seite die Zeichensatzergebnisse nicht definiert sind, wird der Zeichensatz des Zeichensatz-Clients als Standardzeichensatz verwendet. Sie müssen also nur den Zeichensatz „character-set-client“ festlegen.
Wir werden also feststellen, dass der im Bild oben gezeigte Zeichensatzserver kein utf8 verwendet (Hinweis: In MySQL wird die utf-8-Kodierungsmethode als utf8 ausgedrückt, ohne „-“). Dies liegt daran, dass die Standardspeichermethode von MySQL ohne Änderung latin1 ist. Wenn wir in diesem Fall das MySQL-Terminal zum Erstellen von Datenbanken und Datentabellen verwenden und der verwendete Zeichensatz nicht in der SQL-Anweisung angegeben ist, ist die für die Speicherung verwendete Codierung latin1. Offensichtlich werden chinesische Zeichen ursprünglich in dieser Codierungsmethode gespeichert Wird zum Speichern von lateinischem Text verwendet, wird er bei der Anzeige definitiv verstümmelt angezeigt.
Wie kann man es also ändern? Sie können setcharact-set-server = utf8; Wenn Sie anschließend SQL zum Erstellen einer Tabelle im Terminal verwenden, ist die Speichercodierungsmethode der Tabelle UTF-8.
Diese Änderung ist jedoch nur für den aktuellen Dienst wirksam. Betreten Sie nach dem Beenden das MySQL-Terminal erneut und Sie werden feststellen, dass sich der Zeichensatz wieder in latin1 geändert hat. Die Informationen, die ich bisher gefunden habe, zeigen, dass die Methode, die Änderungen dauerhaft zu machen, nur durch Ändern der Kompilierungsparameter beim Neukompilieren von MySQL erreicht wird. Wenn es Experten gibt, die wissen, wie dies ohne Kompilierung erreicht werden kann, hinterlassen Sie mir bitte eine Nachricht.
php-Codierung:
Also, wenn es um MySQL geht, wie stellt PHP sicher, dass während des Datenübertragungsprozesses bei der Interaktion mit MySQL keine verstümmelten Zeichen erscheinen?
Laut der Beschreibung unter (*) müssen wir tatsächlich nur die folgenden drei Systemparameter so einstellen, dass sie mit dem Zeichensatz des Server-Zeichensatzes übereinstimmen, um verstümmelte Zeichen beim Speichern und Abrufen von Daten aus MySQL zu verhindern -server Zeichensatz. Dies sind:
character_set_client: Der Zeichensatz des Clients.
character_set_results: Ergebniszeichensatz.
character_set_connection: Verbindungszeichensatz.
Das Festlegen dieser drei Systemparameter kann durch Senden der Anweisung an MySQL erreicht werden: Set Names xxx (xxx kann utf8 sein)
Wenn Sie daher chinesische und andere nicht-englische Zeichen von PHP an MySQL senden möchten, verwenden Sie danach mysql_query( Mit der mysql_connect-Anweisung „set name utf8“); (hier wird davon ausgegangen, dass der Datenbankspeicher utf8 verwendet) können Sie Chinesisch sicher übertragen und abrufen.
Da die HTML-Seite tatsächlich dynamisch von PHP generiert werden kann, stellt sich die Frage, wie sichergestellt werden kann, dass die von der dynamisch von PHP generierten Seite verwendete Codierungsmethode mit der im Header oder deklarierten Methode übereinstimmt?
Suchen Sie die Datei php.ini im PHP-Verzeichnis und ändern Sie default_charset = „utf-8“, damit PHP bei der Ausgabe der Seite utf-8 zum Codieren verwendet.
Empfohlenes Lernen: „PHP-Video-Tutorial“