ホームページ >Java >&#&ベース >Javaで文字が漢字かどうかを判断する方法

Javaで文字が漢字かどうかを判断する方法

尚
オリジナル
2019-11-27 11:09:103348ブラウズ

Javaで文字が漢字かどうかを判断する方法

Java は、文字が漢字実装コードであるかどうかを判断します: (推奨 : Java ビデオ チュートリアル )

 /**
     * 判断一个字符是否是汉字
     * PS:中文汉字的编码范围:[\u4e00-\u9fa5]
     *
     * @param c 需要判断的字符
     * @return 是汉字(true), 不是汉字(false)
     */
    public static boolean isChineseChar(char c) { 
           return String.valueOf(c).matches("[\u4e00-\u9fa5]");
    }

例:

/**
 * 判断一个字符是否是汉字
 *
 * @author Yawei Xi
 * @date 2018-8-20
 */
public class Test {
    public static void main(String[] args) {
        char a = ' ';
        char b = 0;
        char c = 'a';
        char d = '中';

        System.out.println(isChineseChar(a));
        System.out.println(isChineseChar(b));
        System.out.println(isChineseChar(c));
        System.out.println(isChineseChar(d));
    }

    /**
     * 判断一个字符是否是汉字
     * PS:中文汉字的编码范围:[\u4e00-\u9fa5]
     *
     * @param c 需要判断的字符
     * @return 是汉字(true), 不是汉字(false)
     */
    public static boolean isChineseChar(char c) {
        return String.valueOf(c).matches("[\u4e00-\u9fa5]");
    }
}

出力結果:

false
false
false
true

Java は Unicode エンコードを使用しています。char 型変数の範囲は 0 ~ 65535 です。符号なしの値は 65536 文字を表現できます。基本的に地球上の文字です。

中国語文字は基本的に [19968, 40869] の間に集中し、合計 20901 文字になります

Unicode エンコード範囲:

中国語文字: [0x4e00, 0x9fa5] (または 10 進数 [19968,40869])

全角文字エンコーディング範囲

1.GBK (GB2312/GB18030)

/x00-/xff GBK double -バイトエンコード範囲

/x20-/x7f ASCII

/xa1-/xff 中国語 gb2312

/x80-/xff 中国語 gbk

2。 UTF-8 (Unicode)

/u4e00-/u9fa5 (中国語)

Java の詳細については、Java 基本チュートリアル 列に注目してください。

以上がJavaで文字が漢字かどうかを判断する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。