搜尋
首頁後端開發PHP問題如何用php實現unicode和utf8的轉換?

如何用php實現unicode和utf8的轉換?

Jul 10, 2020 am 11:03 AM
phpunicodeutf8

用php實現unicode和utf8轉換的方法:首先對於【4-6】字節編碼的情況不必考慮;然後出現四字節以上的【utf-8】字符,可以直接視為亂碼忽略掉或轉為unicode實體形式即可,代號為【$utf8char = "{$c};"】。

如何用php實現unicode和utf8的轉換?

用php實現unicode和utf8轉換的方法:

  unicode編碼是實作utf-8與gb系列編碼(gb2312、gbk、gb18030)轉換的基礎,雖然我們也可以直接做一個utf-8到這些編碼的對照表,但很少有人會這麼做,因為utf-8的可變編碼具有不確定性,因此一般情況使用都是unicode與gb編碼的對照表,unicode(UCS-2)其實是utf-8的基礎編碼,utf-8只是它的一種實現而已,兩者存在下面的對應關係:

  • Unicode符號範圍範圍範圍          | UTF-8編碼方式

  • u0000 0000 - u0000 007F  | 0xxxxx

    xxx #u0000 0080 - u0000 07FF   | 110xxxxx 10xxxxxx
  • u0000 0800 - u0000 FFFF   | 1110xxxxx 100xxx 1000 FFFF   | 1110xxxx 10xxx#1000都是居於UCS-2的,因此對於4-6字節編碼的情況是不必考慮的,同樣地,在反向轉換的時候,如果出現四字節以上的utf-8字符,可以直接視為亂碼忽略掉或轉為unicode實體形式("long int;"形式),然後交給瀏覽器或相關解析程序去處理,用php把unicode轉為utf-8編碼的演算法如下:
  • /*
     * 参数 $c 是unicode字符编码的int类型数值,如果是用二进制读取的数据,在php中通常要用 hexdec(bin2hex( $bin_unichar )) 这样转换
     */
    function uni2utf8( $c )
    {
      if ($c < 0x80)
      {
            $utf8char = chr($c);
      }
      else if ($c < 0x800)
      {
            $utf8char = chr(0xC0 | $c >> 0x06).chr(0x80 | $c & 0x3F);
      }
      else if ($c < 0x10000)
      {
            $utf8char = chr(0xE0 | $c >> 0x0C).chr(0x80 | $c >> 0x06 & 0x3F).chr(0x80 | $c & 0x3F);
      }
      //因为UCS-2只有两字节,所以后面的情况是不可能出现的,这里只是说明unicode HTML实体编码的用法。
      else
      {
            $utf8char = "&#{$c};";
      }
      return $utf8char;
    }
  • 在目前的環境範圍內,可以認為utf-8字元集==unicode(UCS-2),但從理論上,主要字元集關係的包含關係如下:

    utf-8 > unicode(UCS-2) > gb18030 > gbk > gb2312

    因此,如果編碼在正確的情況下:
  • gb2312 => gbk => gb18030 => unicode(UCS-2) => utf-8
   

這樣的一個轉變過程,基本上是無損的,但反而言之,由

utf-8 => unicode(UCS-2) => gb18030=> gbk => gb2312

   

#這樣的轉變過程,是很可能存在不能辨識的字元的,因此,如果對於使用utf-8編碼的系統,盡量不要輕易的去做反向轉換編碼的操作。

相關學習推薦:

PHP程式設計從入門到精通

#

以上是如何用php實現unicode和utf8的轉換?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
酸與基本數據庫:差異和何時使用。酸與基本數據庫:差異和何時使用。Mar 26, 2025 pm 04:19 PM

本文比較了酸和基本數據庫模型,詳細介紹了它們的特徵和適當的用例。酸優先確定數據完整性和一致性,適合財務和電子商務應用程序,而基礎則側重於可用性和

PHP安全文件上傳:防止與文件相關的漏洞。PHP安全文件上傳:防止與文件相關的漏洞。Mar 26, 2025 pm 04:18 PM

本文討論了確保PHP文件上傳的確保,以防止諸如代碼注入之類的漏洞。它專注於文件類型驗證,安全存儲和錯誤處理以增強應用程序安全性。

PHP輸入驗證:最佳實踐。PHP輸入驗證:最佳實踐。Mar 26, 2025 pm 04:17 PM

文章討論了PHP輸入驗證以增強安全性的最佳實踐,重點是使用內置功能,白名單方法和服務器端驗證等技術。

PHP API率限制:實施策略。PHP API率限制:實施策略。Mar 26, 2025 pm 04:16 PM

本文討論了在PHP中實施API速率限制的策略,包括諸如令牌桶和漏水桶等算法,以及使用Symfony/Rate-limimiter之類的庫。它還涵蓋監視,動態調整速率限制和手

php密碼哈希:password_hash和password_verify。php密碼哈希:password_hash和password_verify。Mar 26, 2025 pm 04:15 PM

本文討論了使用password_hash和pyspasswify在PHP中使用密碼的好處。主要論點是,這些功能通過自動鹽,強大的哈希算法和SECH來增強密碼保護

OWASP前10 php:描述並減輕常見漏洞。OWASP前10 php:描述並減輕常見漏洞。Mar 26, 2025 pm 04:13 PM

本文討論了OWASP在PHP和緩解策略中的十大漏洞。關鍵問題包括注射,驗證損壞和XSS,並提供用於監視和保護PHP應用程序的推薦工具。

PHP XSS預防:如何預防XSS。PHP XSS預防:如何預防XSS。Mar 26, 2025 pm 04:12 PM

本文討論了防止PHP中XSS攻擊的策略,專注於輸入消毒,輸出編碼以及使用安全增強的庫和框架。

PHP接口與抽像類:何時使用。PHP接口與抽像類:何時使用。Mar 26, 2025 pm 04:11 PM

本文討論了PHP中接口和抽像類的使用,重點是何時使用。界面定義了無實施的合同,適用於無關類和多重繼承。摘要類提供常見功能

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器