Rumah >pembangunan bahagian belakang >masalah PHP >如何用php实现unicode和utf8的转换？

如何用php实现unicode和utf8的转换？

coldplay.xixiasal: 2020-07-10 11:03:163566semak imbas

用php实现unicode和utf8转换的方法：首先对于【4-6】字节编码的情况不必考虑；然后出现四字节以上的【utf-8】字符，可以直接视为乱码忽略掉或转为unicode实体形式即可，代码为【$utf8char = "&#{$c};"】。

用php实现unicode和utf8转换的方法：

unicode编码是实现utf-8与gb系列编码(gb2312、gbk、gb18030)转换的基础，虽然我们也可以直接做一个utf-8到这些编码的对照表，但很少有人会这么做，因为utf-8的可变编码具有不确定性，因此一般情况使用都是unicode与gb编码的对照表，unicode(UCS-2)实际上是utf-8的基础编码，utf-8只是它的一种实现而已，两者存在下面的对应关系：

Unicode符号范围 | UTF-8编码方式
u0000 0000 - u0000 007F | 0xxxxxxx
u0000 0080 - u0000 07FF | 110xxxxx 10xxxxxx
u0000 0800 - u0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx

由于目前utf-8使用的字符都是居于UCS-2的，因此对于4-6字节编码的情况是不必考虑的，同样地，在反向转换的时候，如果出现四字节以上的utf-8字符，可以直接视为乱码忽略掉或转为unicode实体形式("&#long int;"形式)，然后交给浏览器或相关解析程序去处理，用php把unicode转为utf-8编码的算法如下：

/*
 * 参数 $c 是unicode字符编码的int类型数值，如果是用二进制读取的数据，在php中通常要用 hexdec(bin2hex( $bin_unichar )) 这样转换
 */
function uni2utf8( $c )
{
  if ($c < 0x80)
  {
        $utf8char = chr($c);
  }
  else if ($c < 0x800)
  {
        $utf8char = chr(0xC0 | $c >> 0x06).chr(0x80 | $c & 0x3F);
  }
  else if ($c < 0x10000)
  {
        $utf8char = chr(0xE0 | $c >> 0x0C).chr(0x80 | $c >> 0x06 & 0x3F).chr(0x80 | $c & 0x3F);
  }
  //因为UCS-2只有两字节，所以后面的情况是不可能出现的，这里只是说明unicode HTML实体编码的用法。
  else
  {
        $utf8char = "&#{$c};";
  }
  return $utf8char;
}

在目前的环境范围内，可以认为 utf-8字符集==unicode(UCS-2)，但从理论上，主要字符集关系的包含关系如下：

utf-8 > unicode(UCS-2) > gb18030 > gbk > gb2312

因此，如果编码都正确的情况下：

gb2312 => gbk => gb18030 => unicode(UCS-2) => utf-8

这样的一个转变过程，基本上是无损的，但反而言之，由

utf-8 => unicode(UCS-2) => gb18030=> gbk => gb2312

这样的转变过程，是很可能存在不能识别的字符的，因此，如果对于使用utf-8编码的系统，尽量不要轻易的去做反向转换编码的操作。

相关学习推荐：PHP编程从入门到精通

Atas ialah kandungan terperinci 如何用php实现unicode和utf8的转换？. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：php如何删除文件中任意一行？Artikel seterusnya：php连接mysql数据库报错了怎么办

Artikel berkaitan

Lihat lagi