ホームページ  >  記事  >  Java  >  Javaで文字列が中国語かどうかを判断する

Javaで文字列が中国語かどうかを判断する

尚
オリジナル
2019-11-22 17:12:542605ブラウズ

Javaで文字列が中国語かどうかを判断する

Java は Unicode エンコードを使用します。char 型変数の範囲は 0 ~ 65535 です。符号なしの値は 65536 文字を表すことができます。基本的に地球上のすべての文字を含めることができます。実際には、 , ビジネス ニーズを満たすために、文字が漢字であるかどうか、または文字列内の文字に中国語の文字が含まれているかどうかを判断したいと考えています。String クラスには、文字の長さ length() を取得するメソッドがあります。以下の例を参照してください。

String s1 = "我是中国人";  
String s2 = "imchinese";  
String s3 = "im中国人";  
System.out.println(s1+":"+new String(s1).length());  
System.out.println(s2+":"+new String(s2).length());   
System.out.println(s3+":"+new String(s3).length());

出力:

私は中国人です:5

imchinese:9

im中文:5

java は文字を決定します。文字列は中国語です:

/**
 * 判断该字符串是否为中文
 * @param string
 * @return
 */
public static boolean isChinese(String string){
    int n = 0;
    for(int i = 0; i < string.length(); i++) {
        n = (int)string.charAt(i);
        if(!(19968 <= n && n <40869)) {
            return false;
        }
    }
    return true;
}

Unicode エンコード範囲:

中国語の文字: [0x4e00,0x9fa5] (または 10 進数 [19968,40869])

数字: [ 0x30,0x39] (または 10 進数 [48, 57])

小文字: [0x61,0x7a] (または 10 進数 [97, 122])

大文字: [0x41,0x5a] (または 10 進数 [65, 90])

unicode 中国語範囲

中国語文字エンコード範囲:\u4e00-\u9FA5

2 バイト文字エンコード範囲:\u0391- \ uFFE5

Java の詳細については、Java 基本チュートリアル を参照してください。

以上がJavaで文字列が中国語かどうかを判断するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。