ホームページ  >  記事  >  Unicode と ASCII の違いは何ですか

Unicode と ASCII の違いは何ですか

百草
百草オリジナル
2023-09-06 11:56:065717ブラウズ

Unicode と ASCII の違いには、エンコード範囲の違い、記憶領域の違い、互換性の違いなどが含まれます。詳細な紹介: 1. エンコード範囲が異なります。ASCII のエンコード範囲は 0 ~ 127 で、主に英語の文字を表すために使用されます。Unicode のエンコード範囲はさらに広く、ほぼすべての言語の文字を表すことができます。2. ストレージASCII は通常 1 バイトを使用して文字を格納しますが、Unicode は 2 バイト以上を使用して文字を格納する場合があります; 3. 互換性の違いなど

Unicode と ASCII の違いは何ですか

このチュートリアルのオペレーティング システム: Windows 10 システム、DELL G3 コンピューター。

1. Unicode とは

Unicode は文字エンコーディング標準であり、その目標は、世界中のすべての文字に対して少数のコードを設定することです。英語文字、漢字、日本語文字、ハングル文字、アラビア数字など、ほぼすべての言語の文字に対応できます。

2. ASCII とは

ASCII (American Standard Code for Information Interchange、American Standard Code for Information Interchange) は、英語の文字に基づいた文字エンコーディングです。 1 つの文字を表すのに 7 ビットを使用し、大文字と小文字の英字、アラビア数字、句読点、および一部の制御文字を含む、合計 128 個の異なる文字を表すことができます。

3. Unicode と ASCII

Unicode と ASCII の違いは主に次の点に反映されます: 1. エンコード範囲の違い; 2 . 収納スペースの違い; 3. 互換性の違い。一般に、Unicode には ASCII よりも多くの文字が含まれており、より多くの言語を表現できます。

1. 異なるコーディング範囲

ASCII のコーディング範囲は 0 ~ 127 で、主に英語の文字を表すために使用されますが、Unicode のコーディング範囲はさらに広く、ほぼすべての文字を表現できます。言語の文字。

2. 異なる記憶スペース

ASCII エンコードでは通常、文字の保存に 1 バイトが使用されますが、Unicode エンコードでは文字の保存に 2 バイト以上が使用される場合があります。

3. 異なる互換性

ASCII エンコードは Unicode エンコードの一部です。つまり、すべての ASCII 文字は Unicode エンコードに対応するエンコードを持ちます。これは、ASCII エンコードされたテキストを、情報を失うことなく Unicode エンコードに直接変換できることも意味します。

4.UTF8

  • そこで、保護の精神から、Unicode エンコーディングを「可変長エンコーディング」に変換する UTF-8 エンコーディングが登場しました。
  • UTF-8 エンコーディングは、Unicode 文字をさまざまな数値サイズに応じて 1 ~ 6 バイトにエンコードします。一般的に使用される英語の文字は 1 バイトにエンコードされます。中国語の文字は通常 3 バイトで、いくつかの珍しい文字のみがエンコードされます。 4 ~ 6 バイトにエンコードされます。送信するテキストに英語の文字が多く含まれている場合は、UTF-8 エンコードを使用するとスペースを節約できます。
#文字ASCIIUnicodeUTF-8#A中文
01000001 00000000 01000001 01000001
x 01001110 00101101 01001110 00101101
#上記の表から、UTF-8 エンコーディングには追加の利点は、ASCII エンコードは実際には UTF-8 エンコードの一部と見なせることです。そのため、ASCII エンコードのみをサポートする多くの歴史的なレガシー ソフトウェアは、UTF-8 エンコードでも引き続き動作できます。
5. コンピューターにおける一般的な文字エンコーディングの仕組み

コンピューターのメモリでは、Unicode エンコーディングが均一に使用され、必要な場合には、Unicode エンコーディングが使用されます。ハードディスクに保存するか、送信する必要がある場合はUTF-8エンコードに変換してください。
  • メモ帳で編集すると、ファイルから読み込んだ UTF-8 文字が Unicode 文字に変換されてメモリに保存され、編集完了後、保存時に Unicode が UTF-8 に変換されます。ファイルへ:
  • Unicode と ASCII の違いは何ですか

    #Web を閲覧すると、サーバーは動的に生成された Unicode コンテンツを UTF-8 に変換し、ブラウザへ:
  • Unicode と ASCII の違いは何ですか#

以上がUnicode と ASCII の違いは何ですかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。