HTML 基本チュートリアル ...LOGIN

HTML 基本チュートリアル コンピュータコーディング (文字セット)

コンピューターのエンコーディング (文字セット) - コンピューターはバイナリ データのみを処理できるため、

なぜ文字セットがあるのか​​を理解します。コンピューターが人間の言語 (0 ~ 9、a ~ z、A ~ Z、特殊記号) を認識するには、各文字を「エンコード」する必要があります。いわゆる「エンコーディング」とは、各文字を異なるバイナリ システムで表現できることを意味します。

仮定: A は 2 進数で 1000 を表し、B は 2 進数で 1001 を表します。

ASCII エンコード: すべての文字を表すのに 1 バイト (8 ビット 2 進数) が使用され、合計 2^8 = 256 を表すことができます。

ANSI エンコーディング: 他の国では、自国の言語を表示するために ASCII エンコーディングを拡張しています。

  • ANSI (中国語のオペレーティング システムでは gb2312

  • ANSI)、従来のオペレーティング システムでは big5

  • ANSI、日本語のオペレーティング システムでは JIS

  • ...

  • 2 バイト (16 ビット バイナリ) を使用します (表現するには、合計 2^16 = 65536 文字を表現できます。

  • GB2312 には、合計 6763 の漢字が含まれます。

  • GBK エンコード: GB2312)一部の人気のない文字、珍しい文字、古代中国語などを拡張して収録

  • 漢字を合計21,000文字収録

Unicodeエンコーディング:世界中のすべての文字を統一してエンコードし、4つの文字を使用する予定です。

    欠点: 1 つの文字を表すために 32 ビット バイナリを使用すると、スペースが膨大に消費されます。
  • 前提条件: 1 000000000000000000000000000001 を表すには Unicode エンコーディングを使用します。

UTF-8: 統一変換形式エンコーディング (多言語エンコーディング)

異なる文字の場合、翻訳に適切なエンコーディングが選択されます

例: 1 ASCII メディア エンコーディング (8 ビット バイナリ)


「国」を使用できます。

🎜🎜🎜 を表すために 2 バイトを使用できます。次のセクション
<!DOCTYPE HTML> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> <title>这是我们的第一个页面</title> </head> <body> <h1>欢迎加入php.cn</h1> <h2>希望你能够在这里学的开心</h2> </body> </html>
コースウェア