首頁  >  文章  >  在ascii碼檔案中一個英文字母佔多少個位元組

在ascii碼檔案中一個英文字母佔多少個位元組

藏色散人
藏色散人原創
2021-11-22 15:07:0619490瀏覽

在ascii碼檔案中一個英文字母佔一個字節,一個中文漢字佔兩個位元組的空間;ascii碼使用指定的7位元或8位元二進位數組合來表示128或256種可能的字符,而位元組就是二進位資料的單位,一個位元組通常8位元長。

在ascii碼檔案中一個英文字母佔多少個位元組

本文操作環境:Windows7系統、Dell G3電腦。

在ascii碼檔案中一個英文字母佔多少個位元組?

在ASCII碼中,一個英文字母(不分大小寫)佔一個位元組的空間,一個中文漢字佔兩個位元組的空間。

ASCII :

ASCII ((American Standard Code for Information Interchange): 美國資訊交換標準代碼)是基於拉丁字母的一套電腦編碼系統,主要用於顯示現代英語和其他西歐語言。它是最通用的資訊交換標準,並等同於國際標準ISO/IEC 646。 ASCII第一次以規範標準的類型發表是在1967年,最後一次更新則是在1986年,到目前為止共定義了128個字元 。

ASCII 碼使用指定的7 位元或8 位元二進位數組合來表示128 或256 個可能的字元。標準ASCII 碼也叫基礎ASCII碼,使用7 位二進制數(剩下的1位二進制為0)來表示所有的大寫和小寫字母,數字0 到9、標點符號,以及在美式英語中使用的特殊控制字符[1]  。其中:

0~31及127(共33個)是控製字元或通訊專用字元(其餘為可顯示字元),如控制符:LF(換行)、CR(Enter)、FF(換頁)、DEL(刪除)、BS(退格)、BEL(響鈴)等;通訊專用字元:SOH(文頭)、EOT(文字尾)、ACK(確認)等;ASCII值為8、9 、10 和13 分別轉換為退格、製表、換行和回車字元。它們並沒有特定的圖形顯示,但會根據不同的應用程序,而對文字顯示有不同的影響 [1]  。

32~126(共95個)是字元(32是空格),其中48~57為0到9十個阿拉伯數字。

65~90為26個大寫英文字母,97~122號為26個小寫英文字母,其餘為一些標點符號、運算符號等。

同時也要注意,在標準ASCII中,其最高位元(b7)用作奇偶校驗位。所謂奇偶校驗,是指在程式碼傳送過程中用來檢驗是否出現錯誤的一種方法,一般分奇校驗和偶校驗兩種。奇校驗規定:正確的代碼一個位元組中1的個數必須是奇數,若非奇數,則在最高位b7添1;偶校驗規定:正確的代碼一個位元組中1的個數必須是偶數,若非偶數,則在最高位b7添1 。

後128個稱為擴充ASCII碼。許多基於x86的系統都支援使用擴展(或“高”)ASCII。擴展ASCII 碼允許將每個字元的第8 位元用於確定附加的128 個特殊符號字元、外來語字母和圖形符號 。

位元組:

位元組是二進位資料的單位。一個位元組通常8位元長。但是,一些舊型號計算機結構使用不同的長度。為了避免混亂,在大多數國際文獻中,使用字詞代替byte。在多數的電腦系統中,一個位元組是一個8位元長的資料單位,大多數的計算機都用一個位元組表示一個字元、數字或其他字元。一個位元組也可以表示一系列二進位位元。在一些電腦系統中,4 個位元組代表一個字,這是電腦在執行指令時能夠有效處理資料的單位。有些語言描述需要2個位元組表示一個字符,這叫做雙字節字符集。一些處理器能夠處理雙位元組或單字節指令。位元組通常簡寫為“B”,而位元通常簡寫為小寫“b”,電腦記憶體的大小通常用位元組來表示  。

更多相關知識,請造訪常見問題欄位!

以上是在ascii碼檔案中一個英文字母佔多少個位元組的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn