首頁  >  文章  >  Java  >  Unicode和UTF-8差別是什麼

Unicode和UTF-8差別是什麼

青灯夜游
青灯夜游原創
2018-11-22 10:53:478398瀏覽

本篇文章帶給大家的內容是介紹Unicode和UTF-8是什麼,讓大家了解Unicode和UTF-8之間的差異(差異)。有一定的參考價值,有需要的朋友可以參考一下,希望對你們有幫助。

什麼是Unicode(統一碼)?

Unicode 是用兩個位元組表示每個字元的字元編碼方案。 Unicode給每個字元和符號在 0 到 65,535 (216 – 1) 範圍內定義了一個唯一的數字,不論是什麼平台,不論是什麼程序,不論什麼語言。

什麼是UTF-8?

UTF-8 是一種用於將寬字元值轉換為位元組流的Unicode 的標準機制,一種編碼格式;可以用1到6個位元組來編碼Unicode字元。

Unicode和UTF-8的區別

#Unicode是一種字元集,而,UTF-8是一種編碼規則。

字元集是具有唯一編號的字元清單(這些編號有時稱為「碼位 / 碼點 / Code Point」)。簡單來說,就是為每一個「字元」分配一個唯一的 ID。例如,在Unicode字元集中,A的數字為41。

編碼規則:是將「碼位」轉換為位元組序列的規則(編碼/解碼可以理解為加密/解密的過程),是一種將數字列表轉換為二進位的演算法,因此可以將其儲存在磁碟上。

例如,UTF-8會像這樣翻譯數字序列:1,2,3,4:

#00000001 00000010 00000011 00000100

我們的資料現在已翻譯成二進位文件,現在可以儲存到磁碟。

Unicode與UTF-8關係圖:

Unicode和UTF-8差別是什麼

#結論:

UTF -8是用於將二進位資料轉換為數字的編碼;Unicode是用於將數字轉換為字元的字元集。

以上就是這篇文章的全部內容,希望能對大家的學習有所幫助。更多相關視頻教程,可訪問:java教程

以上是Unicode和UTF-8差別是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn