Le développement Web implique souvent une interaction de données entre les pages Web frontales - PHP - MySQL. Lorsque les données sont uniquement en anglais, il n'y a généralement pas de problème, mais lorsqu'il s'agit de chinois, l'encodage des caractères aux trois endroits est incohérent (par exemple, lorsque la page Web utilise gbk et que mysql utilise utf-8) , cela peut conduire à des caractères tronqués
(Remarque : concernant l'encodage des caractères. Veuillez vous référer à l'Encyclopédie Baidu : http://baike.baidu.com/view/1204863.htm?fr=aladdin)
Page Web frontale encoding :
Habituellement, nous pensons tous que nous pouvons transmettre les éléments < dans la balise
(tels que ) pour définir le codage des caractères de la page entière. La plupart des pages peuvent utiliser cette méthode pour indiquer au navigateur. Quel codage est utilisé lorsque le navigateur affiche cette page, mais parfois nous constaterons que cette phrase ne fonctionne toujours pas. Quel que soit le xxx, le navigateur utilise toujours le même encodageCette situation implique http. La partie en-tête dans la communication protocolaire. En fait, lorsqu'un utilisateur navigue sur une page Web, le contenu envoyé par le serveur à l'utilisateur ne comprend pas seulement. notre page Web (y compris le contenu du code tel que html/css/js), mais comprend également ce qu'on appelle l'en-tête (header), qui informera le client du type de données à recevoir (qu'il s'agisse de HTML, de texte brut, fichiers multimédias, etc.), taille, source et autres informations (si vous souhaitez voir ces informations, vous pouvez utiliser l'outil telnet (au lieu d'utiliser le navigateur, essayez de lancer vous-même des requêtes get selon le protocole http.) Depuis l'en-tête est envoyé avant le code HTML, dans le cadre du code HTML, sa priorité est également inférieure à celle de l'en-tête. Une description du codage des caractères de la page Web a été incluse et le navigateur le fera. éventuellement analyser la page Web en fonction du jeu de codage de caractères spécifié dans l'en-tête.
En PHP, vous pouvez utiliser header("content-type:text/html; charset=xxx. ");
Pour le serveur Apache, il dispose d'une fonction AddDefaultCharset, ce qui signifie que l'en-tête correspondant sera défini en fonction du jeu de caractères par défaut du serveur pour chaque page Web envoyée
Vérifiez /etc/apache2/httpd.conf (avant 2.4. ) ou /etc/apache2/conf-available/charset.conf (2.4 et versions ultérieures). Il existe une phrase AddDefaultCharset xxx Si cette phrase n'est pas commentée, alors pour chaque fonction d'ajout d'un en-tête de jeu de caractères par défaut à une page Web. est activé À ce stade, la définition du caractère défini dans la balise n'aura aucun effet.
Remarque : La méthode d'encodage indiquée sur la page html doit être cohérente avec la méthode d'encodage utilisée pour enregistrer réellement la page html (en fait du texte brut).
De manière générale, afin d'être compatible avec le chinois et encore plus d'autres langues, utiliser l'encodage utf-8 est le moyen le plus simple, car utf-8 prend en charge presque toutes les langues couramment utilisées dans le monde.
Encodage de la base de données mysql :
Dans le terminal, entrez mysql -uusername -ppassword puis entrez le programme de contrôle mysql, puis tapez show variables comme 'character%' (notez qu'il n'y a pas de point-virgule lors de la saisie d'instructions de commande ou sql dans le terminal mysql) peuvent être omises) Vous pouvez voir une image similaire à la suivante :
Ce qui précède répertorie les jeux de caractères utilisés par mysql à différents niveaux, parmi lesquels (*)
character-set- server/default-character-set : jeu de caractères du serveur, utilisé par défaut.
character-set-database : jeu de caractères de la base de données.
character-set-table : jeu de caractères de la table de base de données.
La priorité augmente en séquence. Par conséquent, il vous suffit généralement de définir le jeu de caractères du serveur et de ne pas spécifier le jeu de caractères lors de la création de bases de données et de tables. De cette manière, le jeu de caractères du serveur de jeux de caractères est utilisé de manière uniforme.
character-set-client : jeu de caractères du client. Jeu de caractères par défaut du client. Lorsqu'un client envoie une requête au serveur, la requête est codée dans ce jeu de caractères.
character-set-results : jeu de caractères de résultat. Lorsque le serveur renvoie des résultats ou des informations au client, les résultats sont codés dans ce jeu de caractères.
Côté client, si le jeu de caractères résultats n'est pas défini, le jeu de caractères jeu de caractères client est utilisé comme jeu de caractères par défaut. Il vous suffit donc de définir le jeu de caractères client.
Nous constaterons donc que le serveur de jeux de caractères montré dans l'image ci-dessus n'utilise pas utf8 (remarque : dans MySQL, la méthode d'encodage utf-8 est exprimée comme utf8, sans "-"). En effet, la méthode de stockage par défaut de MySQL est latin1 sans modification. Dans ce cas, lorsque nous utilisons le terminal mysql pour créer des bases de données et des tables de données, si le jeu de caractères utilisé n'est pas spécifié dans l'instruction sql, le codage utilisé pour le stockage sera latin1. Évidemment, les caractères chinois sont stockés dans cette méthode de codage à l'origine. utilisé pour stocker le texte latin sera définitivement tronqué une fois affiché.
Alors, comment le modifier ? Vous pouvez utiliser set Character-set-server = utf8; (parce que Character-Set-Server a une priorité élevée, le simple fait de le modifier peut avoir pour effet de modifier la méthode d'encodage du stockage de la base de données). Après cela, lorsque vous utilisez SQL pour créer une table dans le terminal, la méthode de codage de stockage de la table est UTF-8.
Cependant, cette modification n'est efficace que pour le service actuel. Utilisez quit ; pour quitter et entrer à nouveau dans le terminal mysql, vous constaterez que le jeu de caractères est revenu à latin1. Les informations que j'ai trouvées jusqu'à présent montrent que la méthode pour rendre la modification permanente n'est obtenue qu'en modifiant les paramètres de compilation lors de la recompilation de MySQL. S'il y a des experts qui savent comment y parvenir sans compiler, veuillez me laisser un message pour me le faire savoir.
Encodage php :
Alors, en ce qui concerne MySQL, comment PHP garantit-il qu'aucun caractère tronqué n'apparaît lors de la transmission de données lors de l'interaction avec MySQL ?
Selon la description en (*), en fait, afin d'éviter les caractères tronqués lors du stockage et de la récupération des données de MySQL, il suffit de définir les trois paramètres système suivants pour qu'ils soient identiques au jeu de caractères du serveur. -serveur Jeu de caractères. Ce sont :
character_set_client : Le jeu de caractères du client.
character_set_results : jeu de caractères de résultat.
character_set_connection : jeu de caractères de connexion.
La définition de ces trois paramètres système peut être obtenue en envoyant l'instruction à MySQL : définir les noms xxx (xxx peut être utf8)
Par conséquent, lorsqu'il s'agit d'envoyer des caractères chinois et autres caractères non anglais de php vers mysql, utilisez mysql_query( après l'instruction mysql_connect "set names utf8" ; (il est supposé ici que le stockage de la base de données utilise utf8), vous pouvez transmettre et récupérer le chinois en toute sécurité.
De plus, puisque la page HTML peut effectivement être générée dynamiquement par PHP, comment s'assurer que la méthode d'encodage utilisée par la page générée dynamiquement par PHP est la même que celle déclarée dans l'entête ou la ?
Trouvez le fichier php.ini dans le répertoire php et modifiez default_charset = "utf-8" pour que php utilise utf-8 pour encoder lors de la sortie de la page.
Apprentissage recommandé : "Tutoriel vidéo PHP"