ホームページ  >  記事  >  ASCIIコードは何バイトを占めますか?

ASCIIコードは何バイトを占めますか?

百草
百草オリジナル
2023-09-07 16:03:255932ブラウズ

ASCII コードは 1 バイトを占めます。ASCII コードは、文字を表すために使用されるコーディング標準です。7 ビットの 2 進数を使用して、文字、数字、句読点、特殊文字などの 128 個の異なる文字を表します。文字など。バイトはコンピュータの記憶装置の基本単位です。バイトは 8 つのバイナリ ビットで構成されます。各バイナリ ビットは 0 または 1 です。1 バイトは 256 の異なる値を表すことができるため、ASCII コードのすべての文字を表すことができます。

ASCIIコードは何バイトを占めますか?

このチュートリアルのオペレーティング システム: Windows 10 システム、DELL G3 コンピューター。

ASCII コード (American Standard Code for Information Interchange) は、文字を表すために使用されるエンコード標準であり、7 ビットの 2 進数を使用して、文字、数字、句読点、特殊文字を含む 128 個の異なる文字を表します。等コンピュータでは、ASCII コードは通常 8 ビットの 2 進数で表されます。つまり、1 つの ASCII コードが 1 バイト (8 ビット) の記憶領域を占有します。

ASCII コード文字は、コンピュータでは 7 ビットまたは 8 ビットのバイナリ エンコーディングで表され、1 バイトで格納されます。つまり、1 つの ASCII コードが 1 バイトを占めます。

バイト (バイト) はコンピュータの記憶装置の基本単位であり、8 つのバイナリ ビットで構成され、各バイナリ ビットは 0 または 1 になります。 1 バイトは 256 (2^8) の異なる値を表すことができるため、ASCII コードのすべての文字を表すことができます。

コンピュータ技術の発展と国際化の要求に伴い、ASCII コードは Unicode などのより普遍的なコーディング標準に徐々に置き換えられてきたことに注意してください。 Unicode は 16 ビットまたは 32 ビットを使用して文字を表現し、さまざまな言語の文字や記号など、より多くの文字セットを表現できます。

Unicode エンコードを使用する場合、1 つの文字が複数バイトの記憶領域を占有する可能性があります。占有される具体的なバイト数は、UTF-8、UTF-16、UTF-32 など、使用される Unicode エンコード スキームによって異なります。 UTF-8 は、可変長エンコードを使用する一般的な Unicode エンコード スキームであり、文字のエンコード長は 1 ~ 4 バイトの範囲になります。

要約すると、ASCII コードは通常、1 バイト (8 ビット) の記憶領域を占有します。ただし、Unicode エンコーディングが広く適用されているため、文字が複数バイトの記憶領域を占有する場合があり、占有される具体的なバイト数は、使用されている Unicode エンコーディング スキームによって異なります。

ASCIIコードは何バイトを占めますか?

ASCII コードは、標準 ASCII コードと拡張 ASCII コードに分類できます。

標準 ASCII コードは、基本 ASCII コードとも呼ばれます。7 つの 2 進数 (残りの 1 つの 2 進数は 0) を使用して、すべての大文字と小文字、0 ~ 9 の数字、句読点、およびアメリカン スペシャル文字を表します。英語で使用される制御文字。このうち

  • 0 ~ 31 と 127 (合計 33) は制御文字または特殊通信文字 (残りは表示可能な文字)

    たとえば、コントロール文字: LF (ラインフィード)、CR (キャリッジリターン)、FF (ページフィード)、DEL (削除)、BS (バックスペース)、BEL (リング) など;

    通信用の特殊文字: SOH (ヘッダー)、EOT (テキストの終わり)、ACK (確認) など;

    ASCII 値 8、9、10、13 はそれぞれバックスペース、タブ、ラインフィード、キャリッジリターン文字に変換されます。 。特定のグラフィック表示はありませんが、アプリケーションに応じてテキスト表示に異なる効果をもたらします。

  • 32~126(計95)は文字(32はスペース)で、そのうち48~57は0~9までの10個のアラビア数字です。

  • 65 ~ 90 は 26 個の大文字の英字、97 ~ 122 は 26 個の小文字の英字、残りは句読点や算術記号などです。

標準 ASCII では、その最上位ビット (b7) がパリティ ビットとして使用されることにも注意してください。いわゆるパリティチェックとは、符号伝送時にエラーが発生していないかをチェックする方法であり、大きく奇数チェックと偶数チェックの2種類に分けられます。奇数パリティ ルール: 正しいコードの 1 バイト内の 1 の数は奇数である必要があります。奇数でない場合は、最上位ビット b7 に 1 を追加します。偶数パリティ ルール: 正しいコードの 1 バイト内の 1 の数正しいコードは偶数である必要があります。偶数でない場合は、最上位ビット b7 に 1 を加算します。

最後の 128 は拡張 ASCII コードと呼ばれます。多くの x86 ベースのシステムは、拡張 (または「高」) ASCII の使用をサポートしています。拡張 ASCII では、各文字の 8 番目のビットを使用して、追加の 128 個の特殊記号文字、外国文字、およびグラフィック記号を決定できます。

ASCII コード標準テーブルは次のとおりです

##0x03##0000 0100##0x04##0000 0101#ENQ (問い合わせ)#0000 01100680000 10010119 ##01210#013#VT (垂直タブ)垂直タブ0x0CFF (NP フォーム フィード、新しいページ)ページ キー0x0DCR (キャリッジリターン)キーを入力してください0x0ESO (シフトアウト)スイッチする必要はありません##0x0FSI ( シフトin)シフトを有効にする0001 0000020 160x10DLE (データ リンク エスケープ)データ リンク エスケープ0001 0001021170x110001 0010#DC2 (デバイス コントロール 2)023024#025# NAK (否定応答)受け入れ拒否 #026#同期アイドル#02723#0x18EM (媒体の終わり)媒体の終わり#SUB (代替)## の代わりに 0001 10110001 1100#28##0001 1101 035##US (単位区切り文字)単位区切り文字##0010 00000010 0001#!感嘆符042#"35##0010 0100##%パーセント記号0010 01100010 0111 #0x27 '終了一重引用符050#(0x29##* アスタリスク 0010 1011 0010 1100##0010 1101##0x2D-マイナスサイン/ダッシュ056057#0011 0001#0x311キャラクター 1062##0011 0011063## 520x344文字数 4##50011 0110#067550x377文字 7070 #0011 1011610x3D=等号#62##>#0x3F0100 00000100##@0100 0001## 0100 0010##01040100 0101 ##72 0111730x49I大文字 I 0112##K0100 11000100 1101#大文字 M01160100 11110117#80##810x51#0101 0010##大文字 R0123##0101 01000124 ##0x560101 01110101 10000131890x59Y大文字 Y0132900x5AZ大文字 Z#0133# 0x5B[##\バックスラッシュ#0101 11010136940x5E##カレット#0137 ##__アンダースコア##0140#`一重引用符で囲んでください##a#0110 0010##小文字 b0143#小文字の c#1000x65e小文字の e##0x66##g#0110 10000110 1001##0x69 i##0110 1010 107##l小文字l0110 110101551090x6Dm0110 11100110 11110x6F0160##小文字の p1130x71q##0x72##01631150x73s小文字の s#0164##0111 01010165##u小文字の u 118##w小文字w0111 10000170120##y小文字 y01720111 10110173##0177##サイズ ルール
ASCII テーブル
Bin
###(バイナリ)###
10月
(8進数)
12月
(10進数)
16進数
(16進数)
略語/文字
説明
0000 0000
00
0
0x00
NUL(null)
null 文字
0000 0001
01
1
0x01
SOH(見出しの始まり)
タイトルの開始
0000 0010
02
2
0x02
STX (テキストの先頭)
本文の開始
##0000 0011
03
3
##ETX (本文終わり)
終了テキストの
04
#4
##EOT (送信終了)
転送終了
05
5
#0x05
##リクエスト
6
0x06
#ACK (確認)
通知を受け取る
0000 0111
07
7
0x07
BEL (ベル)
ベル
##0000 1000
#010
##0x08
BS (バックスペース)
バックスペース
0x09
HT (水平タブ)
#水平タブ
0000 1010
0x0A
LF (NL 改行、改行)
##改行キー
##0000 1011
11
#0x0B
#0000 1100
##014
##12
0000 1101
015
13
0000 1110
016
14
0000 1111
#017
15
##DC1 (デバイス制御 1)
デバイス制御 1
022
18
##0x12
#デバイス コントロール 2
0001 0011
19
0x13
DC3 (デバイス制御 3)
デバイス制御 3
0001 0100
20
0x14
#DC4 (デバイス制御 4)
デバイス制御 4
#0001 0101
#21
#0x15
##0001 0110
22
##0x16
SYN (同期アイドル)
##0001 0111
0x17
ETB (送信ブロックの終了)
送信終了ブロック
##0001 1000
030
24
#CAN (キャンセル)
##キャンセル
#0001 1001
031
##25
0x19
#0001 1010
032
26
0x1A
033
27
##0x1B
ESC (エスケープ)
エスケープ (オーバーフロー)
#034
##0x1C
#FS ( ファイル区切り文字)
ファイル区切り文字
29
0x1D
GS (グループ区切り文字)
グループ記号
##0001 1110
036
30
0x1E
RS (レコード区切り文字)
レコード区切り文字
0001 1111
##037
#31
0x1F
#040
32
0x20
(スペース)
スペース
041
##33
0x21
##0010 0010
#34
##0x22
#二重引用符
0010 0011
043
##0x23
##044
36
0x24
$
ドル記号
0010 0101
045
#37
0x25
##046
38
0x26
&
and
047
#39
##0010 1000
#40
0x28
#開く括弧
##0010 1001
##051
41
#)
終わり括弧
##0010 1010
052
#42
0x2A
##053
43
0x2B
プラス記号
054
44
0x2C
,
カンマ
##055
45
##0010 1110
46
0x2E
.
期間
0010 1111
47
0x2F
/
#スラッシュ
0011 0000
060
48
0x30
0
文字 0
#061
##49
0011 0010
##50
0x32
2
キャラクター 2
51
0x33
##3
文字3
#0100
064
0011 0101
065
#53
0x35
##文字 5
##066
54
0x36
6
##文字 6
0011 0111
##0011 1000
#56
0x38
8
文字 8
##0011 1001
071
57
0x39
9
文字数 9
0011 1010
072
58
0x3A
:
#コロン
#073
#59
#0x3B
##;
セミコロン
#0011 1100
074
60
0x3C
## より小さいです0011 1101
075
##0011 1110
076
##0x3E
##0011 1111
077
63 ## より大きいです
?
疑問符
#64
0x40
## 電子メールのシンボル
0101
65
0x41
A
##大文字 A
0102
66
0x42
B
大文字 B
##0100 0011
0103
67
0x43
C
大文字の C
0100 0100
68
##0x44
D
大文字 D
#0105
69
0x45
E
大文字 E
0100 0110
0106
70
0x46
F
大文字 F
0100 0111
0107
71
0x47
G
大文字 G
0100 1000
#0110
##0x48
H
##大文字 H
##0100 1001
##01001010
##74
0x4A
J
##大文字 J
0100 1011
0113
#75
0x4B
#大文字 K
0114
76
0x4C
L
##首都 L
0115
##77
0x4D
MM
0100 1110
##78
##0x4E
N
大文字 N
79
0x4F
##大文字の O
#0101 0000
#0120
0x50
#P
#大文字 P
0101 0001
0121
##Q
大文字の Q
##0122
82
0x52
R
0101 0011
##83
0x53
S
大文字 S
84
0x54
T
首都
#0101 0101
0125
85
0x55
U
大文字 U
#0101 0110
##0126
#86
##V
大文字 V
0127
87
0x57
W
##大文字 W
0130
##88
0x58
X
大文字 XXX
#0101 1001
0101 1010
#0101 1011
##91
#開き角括弧
0101 1100
0134
92
0x5C
#0135
##93
0x5D
]
右角括弧
# #0101 1110
##0101 1111
#95
0x5F
#0110 0000
#96
0x60
0110 0001
0141
#97
0x61
##小文字の a
##0142
98
0x62
b
##0110 0011
#99
##0x63
c
##0110 0100
0144
0x64
d
小文字の d
##0110 0101
0145
##101
0110 0110
0146
102
f
小文字 f
0110 0111
0147
#103
0x67
##小文字の g
0150
104
0x68
h
小文字 h
0151
##105
#小文字 i
#0152
106
0x6A
j
小文字の j
0110 1011
##0153
0x6B
k
小文字の k
0110 1100
0154
#108
0x6C
##小文字の m
0156
##110
0x6E
n
小文字 n
0157
111
##o
小文字 o
0111 0000
# #112
##0x70
##p
0111 0001
0161
#小文字 q
0111 0010
0162
114
##r
##小文字の r
#0111 0011
0111 0100
116
0x74
t
小文字 t
117
##0x75
#0111 0110
0166
0x76
v
小文字の v
0111 0111
0167
#119
0x77
#0x78
x
##小文字 x
##0111 1001
0171
121
0x79
##0111 1010
122
0x7A
##z
小文字 z
123
0x7B
##{
左括弧
0111 1100
0174
124
0x7C
|
縦線
0111 1101
0175
125
0x7D
}
閉じ中括弧
0111 1110
##0176
126
0x7E
~
ティルダ
0111 1111
##127
##0x7F
DEL (削除)
削除
共通 ASCIIコード サイズの規則: 数字 数字は文字よりも小さいです。たとえば、「7」
  • 数値 0 は数値 9 より小さく、0 から 9 まで順番に増加します。たとえば、「3」
  • 文字 A は文字 Z より小さく、A から Z の順に増加します。たとえば、 "A"
  • 同じ文字の大文字は、小文字よりも 32 小さくなります。 「A」
  • いくつかの一般的な文字の ASCII コード サイズ: 「A」は 65、「a」は 97、「0」は 48。

以上がASCIIコードは何バイトを占めますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。