首頁 >常見問題 >unicode和ascii有哪些差別

unicode和ascii有哪些差別

百草
百草原創
2023-09-06 11:56:065819瀏覽

unicode和ascii的差異包括編碼範圍不同、儲存空間不同和相容性不同等。詳細介紹:1、編碼範圍不同,ascii的編碼範圍是0-127,主要用於表示英語字母,而unicode的編碼範圍廣闊得多,可以表示幾乎所有的語言字符;2、存儲空間不同,ascii通常使用1個位元組來儲存一個字符,而unicode可能使用2個或更多的位元組來儲存一個字符;3、相容性不同等等。

unicode和ascii有哪些差別

本教學作業系統:windows10系統、DELL G3電腦。

一、Unicode是什麼

Unicode是一種字元編碼標準,其目標是給全世界每個字元都設定一個少數的編碼。它可以容納包括英文字母、中文字元、日文字、韓文字、阿拉伯數字等在內的幾乎所有語言的字元。

二、ASCII是什麼

ASCII(American Standard Code for Information Interchange,美國資訊交換標準代碼)是基於英文字元的字元編碼。它使用7位元來表示一個字符,總共可以表示128個不同的字符,包括大小寫英文字母、阿拉伯數字、標點符號以及一些控製字符。

三、Unicode和ASCII的差異

#unicode和ascii的差異主要體現在:1、編碼範圍不同;2、儲存空間不同;3、相容性不同。總的來說,unicode比ascii包含更多的字符,可以表示更多的語言。

1、編碼範圍不同

ASCII的編碼範圍是0-127,主要用於表示英語字母;而Unicode的編碼範圍廣闊得多,幾乎可以表示所有的語言字元。

2、儲存空間不同

ASCII編碼通常使用1個位元組來儲存一個字符,而Unicode編碼可能使用2個或更多的位元組來儲存一個字元。

3、相容性不同

ASCII編碼是Unicode編碼的一部分,也就是說,所有的ASCII字元在Unicode編碼中都有對應的編碼。這也意味著ASCII編碼的文字可以直接轉換為Unicode編碼,而不會遺失任何資訊。

四、UTF8

  • 所以,本著節約的精神,又出現了把Unicode編碼轉換成「可變長編碼」的UTF-8編碼。
  • UTF-8編碼把一個Unicode字元依照不同的數字大小編碼成1-6個位元組,常用的英文字母被編碼成1個位元組,漢字通常是3個位元組,只有很生僻的字元才會被編碼成4-6個位元組。如果你要傳輸的文字包含大量英文字符,用UTF-8編碼就能節省空間。
字元 ASCII #Unicode UTF-8
A 01000001 #00000000 01000001 01000001
# #x 01001110 00101101 01001110 00101101
#從上面的表格還可以發現,UTF-8編碼有一個額外的好處,就是ASCII編碼實際上可以被看成是UTF-8編碼的一部分,所以,大量只支援ASCII編碼的歷史遺留軟體可以在UTF-8編碼下繼續運作。
五、電腦中通用的字元編碼的工作方式

在電腦記憶體中,統一使用Unicode編碼,當需要儲存到硬碟或者需要傳輸的時候,就轉換為UTF-8編碼。
  • 用記事本編輯的時候,從檔案讀取的UTF-8字元被轉換成Unicode字元到記憶體裡,編輯完成後,儲存的時候再把Unicode轉換為UTF-8儲存到檔案:
  • unicode和ascii有哪些差別

  • 瀏覽網頁的時候,伺服器會把動態產生的Unicode內容轉換成UTF-8再傳輸到瀏覽器:
  • unicode和ascii有哪些差別

以上是unicode和ascii有哪些差別的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn