一個漢字的機內碼需要2個位元組儲存。在國內流行的漢字系統中,一個漢字的機內碼佔2個字節,因為漢字處理系統要確保中西文的兼容,當系統中同時存在ASCII碼和漢字國標碼時,將會產生二義性;為此,漢字機內碼應對國標碼加以適當處理和變換。
本文操作環境:windows10系統、thinkpad t480電腦。
一個漢字的機內碼需要幾個位元組儲存?
一個漢字的機內碼需要2個位元組儲存。
我國國家標準局於1981年5月頒布了《資訊交換用漢字編碼字元集-基本集》,代號為GB2312-80,共對6763個漢字和682個圖形字符進行了編碼,其編碼原則為:漢字用兩個位元組表示。
原則上,兩個位元組可以表示 256×256=65536 種不同的符號,作為漢字編碼表示的基礎是可行的。但考慮到漢字編碼與其它國際通用編碼,如ASCII 西文字元編碼的關係,我國國家標準局採用了加以修正的兩位元組漢字編碼方案,只用了兩個位元組的低7位元。
這個方案可以容納128×128=16384 種不同的漢字,但為了與標準ASCII碼相容,每個位元組中都不能再用32個控制功能碼和碼值為32的空格以及127的操作碼。所以每個位元組只能有94個編碼。這樣,雙七位元實際上能夠表示的字數是:94×94=8836個。
想要查閱更多相關文章,請造訪PHP中文網! !
以上是一個漢字的機內碼需要幾個位元組儲存的詳細內容。更多資訊請關注PHP中文網其他相關文章!