コンピュータおよび電気通信技術において、文字は、グリフの単位、グリフに似た単位、またはシンボルの基本情報です。
文字とは、1、2、3、A、B、C、~! など、コンピュータで使用される文字、数字、単語、記号を指します。・#¥%……—*()—など。
ASCII エンコードでは、英語のアルファベット 1 文字を保存するのに 1 バイトが必要です。
GB 2312 エンコードまたは GBK エンコードでは、1 つの漢字ストレージに 2 バイトが必要です。
UTF-8 エンコードでは、英語のアルファベット文字の格納には 1 バイトが必要で、中国語文字の格納には 3 ~ 4 バイトが必要です。
UTF-16 エンコードでは、英語のアルファベット文字または中国語文字の保存に 2 バイトが必要です (Unicode 拡張領域の一部の中国語文字は、保存に 4 バイトが必要です)。
UTF-32 エンコードでは、世界中の文字を保存するには 4 バイトが必要です。
文字は、さまざまな文字スキームやコード ページを使用して表現できる抽象的なエンティティです。
たとえば、Unicode UTF-16 エンコードは文字を 16 ビット整数のシーケンスとして表しますが、Unicode UTF-8 エンコードは同じ文字を 8 ビット バイトのシーケンスとして表します。 Microsoft の共通言語ランタイムは、Unicode UTF-16 (Unicode Transformation Format、16 ビット エンコード) を使用して文字を表現します。
以上が登場人物は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。