ホームページ  >  記事  >  Java  >  Javaで文字列が中国語かどうかを判断する方法

Javaで文字列が中国語かどうかを判断する方法

尚
オリジナル
2019-11-22 09:28:173897ブラウズ

Javaで文字列が中国語かどうかを判断する方法

Java は Unicode エンコーディングを使用します。char 型変数の範囲は 0 ~ 65535 です。符号なしの値は 65536 文字を表すことができます。基本的に、地球上のすべての文字を含めることができます。

漢字は基本的に [19968, 40869] の間に集中しており、合計 20901 文字になります。

Unicode エンコード範囲:

中国語文字: [0x4e00,0x9fa5] (または 10 進数 [19968,40869])

数値: [0x30,0x39] (または 10 進数 [ 48 , 57])

小文字: [0x61,0x7a] (または 10 進数 [97, 122])

大文字: [0x41,0x5a] (または 10 進数 [65, 90]) )

最初の方法は、中国語の文字があるかどうかを判断することです

public boolean checkcountname(String countname)
    {
         Pattern p = Pattern.compile("[\u4e00-\u9fa5]");
            Matcher m = p.matcher(countname);
            if (m.find()) {
                return true;
            }
            return false;
    }

正規表現を使用して照合します

2 番目の方法は、文字列全体が中国語で構成されているかどうかを判断することです文字

public boolean checkname(String name)
    {
        int n = 0;
        for(int i = 0; i < name.length(); i++) {
            n = (int)name.charAt(i);
            if(!(19968 <= n && n <40869)) {
                return false;
            }
        }
        return true;
    }

Java の詳細については、Java 基本チュートリアル を参照してください。

以上がJavaで文字列が中国語かどうかを判断する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。