Maison >interface Web >Tutoriel H5 >Quel est le codage des caractères ? Comment définir l'encodage des caractères en HTML5 ?

Quel est le codage des caractères ? Comment définir l'encodage des caractères en HTML5 ?

青灯夜游original: 2018-11-12 17:36:2510229parcourir

Le contenu de cet article est de présenter ce qu'est le codage de caractères et comment définir le codage de caractères en html5 ; permettre à tout le monde de comprendre le rôle du codage de caractères et comment définir le codage de caractères en html5. Il a une certaine valeur de référence. Les amis dans le besoin peuvent s'y référer. J'espère qu'il vous sera utile.

Tout d’abord, comprenons Quel est l’encodage des caractères ? A quoi ça sert ?

Le codage de caractères est une méthode de conversion d'octets en caractères. Pour valider ou afficher un document HTML, le programme doit sélectionner un encodage de caractères. Dans la page, nous pouvons définir le codage de "utf-8" pour éviter les caractères chinois tronqués. [Tutoriels vidéo associés recommandés : Tutoriel HTML5]

Il existe trois méthodes de définition du codage des caractères dans HTML 5 Présentons-les respectivement ci-dessous :

En-tête HTTP Content-Type

Si vous écrivez cgi ou un programme similaire, vous pouvez utiliser l'en-tête HTTP Content-Type pour définir n'importe quel codage de caractères.

Voici un exemple simple :

print "Content-Type: text/html; charset=utf-8\r\n";

Élément e8e496c15ba93d81f6ea4fe5f55a2244

Vous pouvez utiliser l'élément e8e496c15ba93d81f6ea4fe5f55a2244 meta> de l'attribut charset, qui peut spécifier l'encodage dans les 512 premiers octets du document HTML5. 00696ab5ea271c012db2592ea759b4afPlus pratique.

Marque d'ordre d'octet (BOM) Unicode

<meta charset="UTF-8">

<meta http-equiv =“Content-Type”content =“text / html; charset = UTF-8”>

La marque d'ordre d'octet (BOM) est constituée du code de caractère U+FEFF au début de le flux de données, où il peut être utilisé comme signature définissant l'ordre des octets et la forme de codage des fichiers en texte brut, principalement non marqués.

De nombreux programmes Windows (y compris le Bloc-notes Windows) ajoutent les octets 0xEF, 0xBB, 0xBF au début de tout document enregistré au format UTF-8. Il s'agit du codage UTF-8 de la marque d'ordre des octets (BOM) Unicode, souvent appelée nomenclature UTF-8, même si cela n'a rien à voir avec l'ordre des octets.

Pour les documents HTML5, vous pouvez utiliser les caractères Unicode Byte Order Mark (BOM) au début du fichier. Ce caractère fournit la signature du codage utilisé. Résumé : ce qui précède représente l'intégralité du contenu de cet article. Vous pouvez choisir différentes méthodes pour définir le codage des caractères en fonction de différentes situations ; j'espère que cela sera utile à votre apprentissage.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Mini programme pour apprendre à obtenir la géolocalisation et afficher les noms de villesArticle suivant：Mini programme pour apprendre à obtenir la géolocalisation et afficher les noms de villes

Articles Liés

Voir plus