Maison  >  Questions et réponses  >  le corps du texte

UTF-8 complet

Je configure un nouveau serveur et souhaite une prise en charge complète de l'UTF-8 dans mon application Web. J'ai essayé cela dans le passé sur des serveurs existants, mais j'ai toujours semblé devoir recourir à la norme ISO-8859-1.

Où dois-je exactement définir l'encodage/le jeu de caractères ? Je sais que je dois configurer Apache, MySQL et PHP pour ce faire. Existe-t-il une liste de contrôle standard que je peux suivre, ou peut-être résoudre les problèmes d'incompatibilité ?

Cela fonctionne sur les nouveaux serveurs Linux exécutant MySQL 5, PHP, 5 et Apache 2.

P粉514458863P粉514458863344 Il y a quelques jours751

répondre à tous(2)je répondrai

  • P粉135292805

    P粉1352928052023-10-16 09:24:17

    J'aimerais ajouter une chose à l'excellente réponse de chazomaticus :

    N'oubliez pas non plus la balise META (comme celle-ci, ou sa version HTML4 ou XHTML) :

    Cela peut sembler trivial, mais IE7 m'a déjà posé des problèmes.

    Je fais tout correctement ; la base de données, la connexion à la base de données et les en-têtes HTTP Content-Type sont tous définis sur UTF-8, qui fonctionne bien dans tous les autres navigateurs, mais Internet Explorer insiste toujours pour utiliser le codage "Europe occidentale".

    Il s'avère qu'il manquait la balise META sur la page. L'ajouter résout le problème.

    Éditeur :

    Le W3C a en fait une assez grande section dédiée à l'I18N. Ils ont un certain nombre d'articles liés à ce problème - décrivant des aspects de HTTP, (X)HTML et CSS :

    Ils recommandent d'utiliser à la fois des en-têtes HTTP et des balises méta HTML (ou des déclarations XML dans le cas de XHTML agissant comme XML).

    répondre
    0
  • P粉536909186

    P粉5369091862023-10-16 00:51:50

    Stockage de données :

    • Spécifiez utf8mb4 字符集。这使得 MySQL 物理地存储和检索以 UTF-8 原生编码的值。请注意,如果指定了 utf8mb4_* 排序规则(没有任何显式字符集),MySQL 将隐式使用 utf8mb4 l'encodage pour toutes les tables et colonnes de texte de la base de données.

    • Dans les anciennes versions de MySQL (< 5.5.3) 中,不幸的是,您将被迫仅使用 utf8, il ne prend en charge qu'un sous-ensemble de caractères Unicode. J'aurais aimé plaisanter.

    Accès aux données :

    utf8mb4

    /utf8 comme mentionné ci-dessus.

    🎜 🎜 🎜🎜Sortie🎜 : 🎜
    • UTF-8 doit être défini dans l'en-tête HTTP, comme la fonction Content-Type:text/html;字符集=utf-8。您可以通过设置 default_charset 在 php.ini 中(首选),或手动使用 header().
    • Si votre application transfère du texte vers d'autres systèmes, ils devront également connaître le codage des caractères. Pour les applications Web, il faut indiquer au navigateur l'encodage dans lequel envoyer les données (via les en-têtes de réponse HTTP ou les métadonnées HTML). < /里>
    • Utilisez json_encode() 对输出进行编码时,添加 JSON_UNESCAPED_UNICODE comme deuxième argument.

    Entrez  :

    • Le navigateur soumettra les données pour le jeu de caractères spécifié par le document, il n'est donc pas nécessaire d'effectuer des opérations spéciales sur l'entrée.
    • Si vous avez des doutes sur l'encodage de la requête (au cas où elle aurait été falsifiée), vous pouvez vérifier que chaque chaîne reçue est UTF-8 valide avant d'essayer de la stocker ou de l'utiliser n'importe où. PHP mb_check_encoding() fait ce qui suit : des astuces, mais vous devez l'utiliser religieusement. Il n'y a vraiment aucun moyen de contourner ce problème, car un client malveillant peut soumettre des données dans le codage de son choix, et je n'ai pas trouvé d'astuce pour que PHP le fasse de manière fiable pour vous.

    Autres notes de code :

    • Évidemment, tous les fichiers que vous fournirez (PHP, HTML, JavaScript, etc.) doivent être codés en UTF-8 valide.

    • Vous devez vous assurer que vous êtes en sécurité chaque fois que vous manipulez des chaînes UTF-8. Malheureusement, c'est la partie la plus difficile. Vous souhaiterez peut-être utiliser largement l'extension mbstring de PHP.

    • Par défaut, les opérations de chaîne intégrées à PHP ne sont pas sécurisées UTF-8. Vous pouvez effectuer en toute sécurité certaines opérations (telles que la concaténation) en utilisant la manipulation normale de chaînes PHP, mais dans la plupart des cas, vous devez utiliser les fonctions mbstring équivalentes.

    • Pour savoir ce que vous faites (lire : ne pas tout gâcher), vous devez vraiment comprendre UTF-8 et comment il fonctionne au niveau le plus bas possible. Consultez l'un des liens sur utf8.com pour accéder à d'excellentes ressources sur tout ce que vous devez savoir.

    répondre
    0
  • Annulerrépondre