在ascii碼檔案中一個英文字母佔一個字節,一個中文漢字佔兩個位元組的空間;ascii碼使用指定的7位元或8位元二進位數組合來表示128或256種可能的字符,而位元組就是二進位資料的單位,一個位元組通常8位元長。
本文操作環境:Windows7系統、Dell G3電腦。
在ascii碼檔案中一個英文字母佔多少個位元組?
在ASCII碼中,一個英文字母(不分大小寫)佔一個位元組的空間,一個中文漢字佔兩個位元組的空間。
ASCII :
ASCII ((American Standard Code for Information Interchange): 美國資訊交換標準代碼)是基於拉丁字母的一套電腦編碼系統,主要用於顯示現代英語和其他西歐語言。它是最通用的資訊交換標準,並等同於國際標準ISO/IEC 646。 ASCII第一次以規範標準的類型發表是在1967年,最後一次更新則是在1986年,到目前為止共定義了128個字元 。
ASCII 碼使用指定的7 位元或8 位元二進位數組合來表示128 或256 個可能的字元。標準ASCII 碼也叫基礎ASCII碼,使用7 位二進制數(剩下的1位二進制為0)來表示所有的大寫和小寫字母,數字0 到9、標點符號,以及在美式英語中使用的特殊控制字符[1] 。其中:
0~31及127(共33個)是控製字元或通訊專用字元(其餘為可顯示字元),如控制符:LF(換行)、CR(Enter)、FF(換頁)、DEL(刪除)、BS(退格)、BEL(響鈴)等;通訊專用字元:SOH(文頭)、EOT(文字尾)、ACK(確認)等;ASCII值為8、9 、10 和13 分別轉換為退格、製表、換行和回車字元。它們並沒有特定的圖形顯示,但會根據不同的應用程序,而對文字顯示有不同的影響 [1] 。
32~126(共95個)是字元(32是空格),其中48~57為0到9十個阿拉伯數字。
65~90為26個大寫英文字母,97~122號為26個小寫英文字母,其餘為一些標點符號、運算符號等。
同時也要注意,在標準ASCII中,其最高位元(b7)用作奇偶校驗位。所謂奇偶校驗,是指在程式碼傳送過程中用來檢驗是否出現錯誤的一種方法,一般分奇校驗和偶校驗兩種。奇校驗規定:正確的代碼一個位元組中1的個數必須是奇數,若非奇數,則在最高位b7添1;偶校驗規定:正確的代碼一個位元組中1的個數必須是偶數,若非偶數,則在最高位b7添1 。
後128個稱為擴充ASCII碼。許多基於x86的系統都支援使用擴展(或“高”)ASCII。擴展ASCII 碼允許將每個字元的第8 位元用於確定附加的128 個特殊符號字元、外來語字母和圖形符號 。
位元組:
位元組是二進位資料的單位。一個位元組通常8位元長。但是,一些舊型號計算機結構使用不同的長度。為了避免混亂,在大多數國際文獻中,使用字詞代替byte。在多數的電腦系統中,一個位元組是一個8位元長的資料單位,大多數的計算機都用一個位元組表示一個字元、數字或其他字元。一個位元組也可以表示一系列二進位位元。在一些電腦系統中,4 個位元組代表一個字,這是電腦在執行指令時能夠有效處理資料的單位。有些語言描述需要2個位元組表示一個字符,這叫做雙字節字符集。一些處理器能夠處理雙位元組或單字節指令。位元組通常簡寫為“B”,而位元通常簡寫為小寫“b”,電腦記憶體的大小通常用位元組來表示 。
更多相關知識,請造訪常見問題欄位!
以上是在ascii碼檔案中一個英文字母佔多少個位元組的詳細內容。更多資訊請關注PHP中文網其他相關文章!