Maison > Questions et réponses > le corps du texte
P粉8541192632023-08-28 11:11:30
J'aimerais ajouter une chose à l'excellente réponse de 一个>chazomaticus :
N'oubliez pas non plus la balise META (comme celle-ci, ou sa version HTML4 ou XHTML) :
<meta charset="utf-8">
Cela peut sembler trivial, mais IE7 m'a déjà posé des problèmes.
Je fais tout correctement ; la base de données, la connexion à la base de données et les en-têtes HTTP Content-Type sont tous définis sur UTF-8, qui fonctionne bien dans tous les autres navigateurs, mais Internet Explorer insiste toujours pour utiliser le codage "Europe occidentale".
Il s'avère qu'il manquait la balise META sur la page. L'ajouter résout le problème.
Éditeur :
Le W3C a en fait une assez grande section dédiée à l'I18N. Ils ont un certain nombre d'articles liés à ce problème - décrivant des aspects de HTTP, (X)HTML et CSS :
Ils recommandent d'utiliser à la fois des en-têtes HTTP et des balises méta HTML (ou des déclarations XML dans le cas de XHTML agissant comme XML).
P粉7636623902023-08-28 09:05:50
Stockage de données :
Spécifiez que le utf8mb4
character set on all tables and text columns in your database. This makes MySQL physically store and retrieve values encoded natively in UTF-8. Note that MySQL will implicitly use utf8mb4
encoding if a utf8mb4_*
classement est spécifié (sans aucun jeu de caractères explicite).
Dans les anciennes versions de MySQL (< 5.5.3), vous serez malheureusement obligé d'utiliser simplement utf8
, qui ne prend en charge qu'un sous-ensemble de caractères Unicode.
Accès aux données :
Dans le code de votre application (par exemple PHP), quelle que soit la méthode d'accès à la base de données que vous utilisez, vous devrez définir le jeu de caractères de connexion sur utf8mb4
De cette façon, MySQL n'effectue aucune conversion depuis son UTF-8 natif lorsqu'il transmet des données à. votre candidature et vice versa.
Certains pilotes fournissent leur propre mécanisme de configuration du jeu de caractères de connexion, qui met à jour son propre état interne et informe MySQL de l'encodage à utiliser sur la connexion - c'est généralement l'approche préférée. En PHP :
Si vous utilisez la couche d'abstraction PDO avec PHP ≥ 5.3.6, vous pouvez spécifier charset
dans le DSN:
$dbh = new PDO('mysql:charset=utf8mb4');
Si vous utilisez mysqli, vous pouvez appeler set_charset()
:
$mysqli->set_charset('utf8mb4'); // object oriented style mysqli_set_charset($link, 'utf8mb4'); // procedural style
Si vous êtes coincé avec mysql mais que vous utilisez PHP ≥ 5.2.3, vous pouvez appeler mysql_set_charset
.
Si le pilote ne fournit pas son propre mécanisme pour définir le jeu de caractères de connexion, vous devrez peut-être émettre une requête pour indiquer à MySQL comment votre application s'attend à ce que les données sur la connexion soient codées : SET NAMES 'utf8mb4'
.
La même considération concernant utf8mb4
/utf8
/
Sortie
: 🎜Content-Type: text/html; charset=utf-8
. You can achieve that either by setting default_charset
in php.ini (preferred), or manually using header()
.json_encode()
, add JSON_UNESCAPED_UNICODE
comme deuxième paramètre.Entrez :
mb_check_encoding()
fait l'affaire, mais vous devez l'utiliser religieusement. Il n'y a vraiment aucun moyen de contourner cela, car les clients malveillants peuvent soumettre des données dans le codage de leur choix, et je n'ai pas trouvé d'astuce pour que PHP fasse cela pour vous de manière fiable.Autres notes de code :
Évidemment, tous les fichiers que vous fournirez (PHP, HTML, JavaScript, etc.) doivent être codés en UTF-8 valide.
Vous devez vous assurer que chaque fois que vous traitez une chaîne UTF-8, vous le faites en toute sécurité. C'est malheureusement la partie la plus difficile. Vous souhaiterez probablement utiliser largement l'extension mbstring
de PHP.
Les opérations de chaîne intégrées à PHP ne sont pas par défaut sécurisées UTF-8. Il y a certaines choses que vous pouvez faire en toute sécurité avec les opérations de chaîne PHP normales (comme la concaténation), mais pour la plupart des choses, vous devez utiliser la fonction équivalente .mbstring
utf8.com pour accéder à d'excellentes ressources sur tout ce que vous devez savoir. p>