>  기사  >  Java  >  Java에서 문자열이 중국어인지 확인

Java에서 문자열이 중국어인지 확인

尚
원래의
2019-11-22 17:12:542605검색

Java에서 문자열이 중국어인지 확인

Java는 유니코드 인코딩을 사용합니다. char 유형 변수의 범위는 0~65535입니다. 부호 없는 값은 기본적으로 지구상의 모든 문자를 포함할 수 있습니다. 한자인지, 아니면 문자열의 문자에 비즈니스 요구 사항을 충족하는 한자가 있는지 여부입니다. 아래 예를 참조하세요.

String s1 = "我是中国人";  
String s2 = "imchinese";  
String s3 = "im中国人";  
System.out.println(s1+":"+new String(s1).length());  
System.out.println(s2+":"+new String(s2).length());   
System.out.println(s3+":"+new String(s3).length());

OUTPUT:

I. 중국어인지 여부: 5

imchinese: 9

im 중국어: 5

java는 문자열이 중국어인지 여부를 결정합니다.

/**
 * 判断该字符串是否为中文
 * @param string
 * @return
 */
public static boolean isChinese(String string){
    int n = 0;
    for(int i = 0; i < string.length(); i++) {
        n = (int)string.charAt(i);
        if(!(19968 <= n && n <40869)) {
            return false;
        }
    }
    return true;
}

유니코드 인코딩 범위:

한자: [0x4e00,0x9fa5](또는 십진수 [19968, 40869) ])

숫자: [0x30, 0x39] (또는 십진수 [48, 57])

소문자: [0x61, 0x7a] (또는 십진수 [97, 122])

대문자: [0x41, 0x5a ] (또는 십진수 [65, 90])

유니코드 중국어 범위

한자 인코딩 범위: u4e00-u9FA5

2바이트 문자 인코딩 범위: u0391-uFFE5

더 많은 Java 지식을 보려면 java에 주목하세요. 기본 튜토리얼.

위 내용은 Java에서 문자열이 중국어인지 확인의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.