本篇文章帶給大家的內容是介紹Unicode和UTF-8是什麼,讓大家了解Unicode和UTF-8之間的差異(差異)。有一定的參考價值,有需要的朋友可以參考一下,希望對你們有幫助。
什麼是Unicode(統一碼)?
Unicode 是用兩個位元組表示每個字元的字元編碼方案。 Unicode給每個字元和符號在 0 到 65,535 (216 – 1) 範圍內定義了一個唯一的數字,不論是什麼平台,不論是什麼程序,不論什麼語言。
什麼是UTF-8?
UTF-8 是一種用於將寬字元值轉換為位元組流的Unicode 的標準機制,一種編碼格式;可以用1到6個位元組來編碼Unicode字元。
Unicode和UTF-8的區別
#Unicode是一種字元集,而,UTF-8是一種編碼規則。
字元集是具有唯一編號的字元清單(這些編號有時稱為「碼位 / 碼點 / Code Point」)。簡單來說,就是為每一個「字元」分配一個唯一的 ID。例如,在Unicode字元集中,A的數字為41。
編碼規則:是將「碼位」轉換為位元組序列的規則(編碼/解碼可以理解為加密/解密的過程),是一種將數字列表轉換為二進位的演算法,因此可以將其儲存在磁碟上。
例如,UTF-8會像這樣翻譯數字序列:1,2,3,4:
#00000001 00000010 00000011 00000100
我們的資料現在已翻譯成二進位文件,現在可以儲存到磁碟。
Unicode與UTF-8關係圖:
#結論:
UTF -8是用於將二進位資料轉換為數字的編碼;Unicode是用於將數字轉換為字元的字元集。
以上就是這篇文章的全部內容,希望能對大家的學習有所幫助。更多相關視頻教程,可訪問:java教程!
以上是Unicode和UTF-8差別是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!