検索

ホームページ  >  に質問  >  本文

Java中char只有两个字节,总共才6万多个数值,如何表示所有的汉子?并且我测试了也可以存放日语的一个字或者韩语的

char既然代表了一个字符,就应该能存放所有的字符才对呀,加上乱七八糟的各国语言字符,总不能char只能存放 中日韩的单个字符吧?

高洛峰高洛峰2887日前415

全員に返信(3)返信します

  • PHPz

    PHPz2017-04-17 17:48:01

    Java は Unicode エンコードのみを使用するため、char は中国語の文字を格納できます。 Unicode とは何ですか?
    Unicode (中国語: Universal Code、International Code、Unicode、Unicode) は、コンピューター サイエンスの分野における業界標準です。世界中のほとんどの書記体系を体系化してコード化し、コンピュータがより簡単な方法でテキストを表示および処理できるようにします。

    Unicode は、ユニバーサル文字セットの標準に従って開発され、書籍の形でも出版されています [1]。 Unicode は今日に至るまで継続的に改訂されており、バージョンが新しくなるたびにさらに新しい文字が追加されています。最新バージョンは 8.0.0 [1] で、2015 年 6 月 17 日にリリースされ、100,000 文字以上を受け取りました (100,000 文字は 2005 年に採用されました)。 Unicode でカバーされるデータには、視覚的なグリフ、エンコード方式、標準の文字エンコードに加えて、大文字と小文字などの文字特性も含まれます。
    上記は Wikipedia unicode-Wikipedia からのものです

    上記のことから、Unicode のものは無料ではなく、Unicode 組織によって組み込まれる必要があることがわかります。ただし、現在は一部の中国語、日本語、韓国語の文字のみが含まれており、それらは含まれていない可能性があります。また、Java は Unicode を使用するため、これらの文字が Unicode 組織に含まれている限り、Java はこれらの文字をサポートします。
    あまり良い答えではありません。

    返事
    0
  • 阿神

    阿神2017-04-17 17:48:01

    utf-8 では不十分な場合は、utf-16 があります

    リーリー

    返事
    0
  • 黄舟

    黄舟2017-04-17 17:48:01

    char は、文字を表すには文字 + 句読点の 2 バイトで十分であるため、2 バイトを使用して保存されますが、他の英語以外のテキストや中国語などを追加する場合は、4 バイトでは不十分になる可能性があります。文字については表現できる範囲が広がり、理論的には8バイトも可能
    Unicode 文字セット標準が誕生

    Java の文字は Unicode エンコーディング、16 ビットを使用します

    返事
    0
  • キャンセル返事