Maison > Questions et réponses > le corps du texte
Je configure un nouveau serveur et souhaite une prise en charge complète de l'UTF-8 dans mon application Web. J'ai essayé cela dans le passé sur des serveurs existants, mais j'ai toujours semblé devoir recourir à la norme ISO-8859-1.
Où dois-je exactement définir l'encodage/le jeu de caractères ? Je sais que je dois configurer Apache, MySQL et PHP pour ce faire. Existe-t-il une liste de contrôle standard que je peux suivre, ou peut-être résoudre les problèmes d'incompatibilité ?
Cela fonctionne sur les nouveaux serveurs Linux exécutant MySQL 5, PHP, 5 et Apache 2.
P粉4821083102023-10-16 00:11:18
J'aimerais ajouter une chose à l'excellente réponse de 一个>chazomaticus :
N'oubliez pas non plus la balise META (comme celle-ci, ou sa version HTML4 ou XHTML) :
Cela peut sembler trivial, mais IE7 m'a déjà posé des problèmes.
Je fais tout correctement ; la base de données, la connexion à la base de données et les en-têtes HTTP Content-Type sont tous définis sur UTF-8, qui fonctionne bien dans tous les autres navigateurs, mais Internet Explorer insiste toujours pour utiliser le codage "Europe occidentale".
Il s'avère qu'il manquait la balise META sur la page. L'ajouter résout le problème.
Éditeur :
Le W3C a en fait une assez grande section dédiée à l'I18N. Ils ont un certain nombre d'articles liés à ce problème - décrivant des aspects de HTTP, (X)HTML et CSS :
Ils recommandent d'utiliser à la fois des en-têtes HTTP et des balises méta HTML (ou des déclarations XML dans le cas de XHTML agissant comme XML).
P粉4574458582023-10-16 00:05:39
Stockage de données :
Spécifiez utf8mb4
字符集。这使得 MySQL 物理存储和检索以 UTF-8 原生编码的值。请注意,如果指定了 utf8mb4_*
排序规则(没有任何显式字符集),MySQL 将隐式使用 utf8mb4
l'encodage pour toutes les tables et colonnes de texte de la base de données.
Dans les anciennes versions de MySQL (< 5.5.3) 中,不幸的是,您将被迫仅使用 utf8
, il ne prend en charge qu'un sous-ensemble de caractères Unicode. J'aurais aimé plaisanter.
Accès aux données :
Dans le code de votre application (par exemple PHP), quelle que soit la méthode d'accès à la base de données que vous utilisez, vous devez définir le jeu de caractères de connexion sur utf8mb4
utf8mb4
$dbh = new PDO('mysql:charset=utf8mb4');
Si vous utilisez mysqli, vous pouvez appeler set_charset()
set_charset()
$mysqli->set_charset('utf8mb4'); // object oriented style mysqli_set_charset($link, 'utf8mb4'); // procedural style
Si vous insistez pour utiliser mysql simple mais que vous exécutez PHP ≥ 5.2.3, vous pouvez appeler 代码>
mysql_set_charset
utf8mb4
/utf8
/utf8 comme mentionné ci-dessus.
🎜 🎜 🎜🎜Sortie🎜 : 🎜Content-Type:text/html;字符集=utf-8
。您可以通过设置 default_charset code>
在 php.ini 中(首选),或手动使用 header()
. json_encode()
对输出进行编码时,添加 JSON_UNESCAPED_UNICODE
comme deuxième argument. Entrez :
mb_check_encoding()
fait ce qui suit : des astuces, mais vous devez l'utiliser religieusement. Il n'y a vraiment aucun moyen de contourner ce problème, car un client malveillant peut soumettre des données dans le codage de son choix, et je n'ai pas trouvé d'astuce pour que PHP le fasse de manière fiable pour vous. Autres notes de code :
Évidemment, tous les fichiers que vous fournirez (PHP, HTML, JavaScript, etc.) doivent être codés en UTF-8 valide.
Vous devez vous assurer que vous êtes en sécurité chaque fois que vous manipulez des chaînes UTF-8. Malheureusement, c'est la partie la plus difficile. Vous souhaiterez peut-être utiliser largement l'extension mbstring
de PHP.
Par défaut, les opérations de chaîne intégrées à PHP ne sont pas sécurisées UTF-8. Vous pouvez effectuer en toute sécurité certaines opérations (telles que la concaténation) en utilisant la manipulation normale de chaînes PHP, mais dans la plupart des cas, vous devez utiliser les fonctions mbstring
équivalentes.
Pour savoir ce que vous faites (lire : ne pas tout gâcher), vous devez vraiment comprendre UTF-8 et comment il fonctionne au niveau le plus bas possible. Consultez l'un des liens sur utf8.com pour accéder à d'excellentes ressources sur tout ce que vous devez savoir. p>