Maison  >  Article  >  développement back-end  >  Comment convertir un jeu de caractères en php

Comment convertir un jeu de caractères en php

怪我咯
怪我咯original
2017-07-12 11:25:363650parcourir

Caractère est un terme général désignant divers caractères et symboles, notamment des caractères de différents pays, des signes de ponctuation, des symboles graphiques, des chiffres, etc. Jeu de caractères (Jeu de caractères) est une collection de plusieurs caractères. Il existe de nombreux types de jeux de caractères. Chaque jeu de caractères contient un nombre différent de noms de jeux de caractères courants : jeu de caractères ASCII, jeu de caractères GB2312. Jeu de caractères BIG5, jeu de caractères GB18030, jeu de caractères Unicode, etc. Pour qu'un ordinateur puisse traiter avec précision du texte dans différents jeux de caractères, un codage de caractères est nécessaire afin que l'ordinateur puisse reconnaître et stocker divers textes. Il existe un grand nombre de caractères chinois et ils sont divisés en deux types de caractères, le chinois simplifié et le chinois traditionnel, avec des règles d'écriture différentes. Les ordinateurs ont été conçus à l'origine sur la base de caractères anglais à un octet. Par conséquent, le codage des caractères chinois est une question technique. base de l'échange d'informations chinois.

Cet article présente principalement PHP pour convertir une chaîne de GBK en UTF8 jeu de caractères via iconv. Il a une très bonne valeur de référence, jetons un coup d'œil avec l'éditeur ci-dessous

PHP convertit les chaînes du jeu de caractères GBK en jeu de caractères UTF8 via iconv.

1. Introduction à iconv()

iconvLa fonction peut convertir un fichier de jeu de caractères connu en un autre fichier de jeu de caractères connu. Par exemple : convertissez de GB2312 en UTF-8.

La fonction iconv est intégrée à PHP5 et le jeu de caractères GB est activé par défaut.

2. erreur iconv()

iconv fera une erreur lors de la conversion du caractère "-" en gb2312. La solution est d'ajouter "/" après l'encodage. qui doit être converti. /IGNORE", c'est-à-dire après le deuxième paramètre de la fonction iconv. Comme suit :

iconv("UTF-8", "GB2312//IGNORE", $data)

ignorer signifie ignorer les erreurs lors de la conversion. n'est pas un paramètre ignoré, tous les caractères après celui-ci. Aucune des chaînes ne peut être enregistrée.

3. Exemple iconv()

<?php 
  echo $str= ‘你好,这里是卖咖啡!&#39;; 
  echo &#39;<br />&#39;; 
  echo iconv(&#39;GB2312&#39;, &#39;UTF-8&#39;, $str); //将字符串的编码从GB2312转到UTF-8 
  echo &#39;<br />&#39;; 
  echo iconv_substr($str, 1, 1, &#39;UTF-8&#39;); //按字符个数截取而非字节 
  print_r(iconv_get_encoding()); //得到当前页面编码信息 
  echo iconv_strlen($str, &#39;UTF-8&#39;); //得到设定编码的字符串长度 
?>

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn