ホームページ  >  記事  >  Java  >  Javaは文字列に中国語の文字が含まれているかどうかを判断しますか?

Javaは文字列に中国語の文字が含まれているかどうかを判断しますか?

青灯夜游
青灯夜游オリジナル
2019-12-31 15:13:224071ブラウズ

Javaは文字列に中国語の文字が含まれているかどうかを判断しますか?

java判断字符串中是否包含中文?

方法1、针对每个字符判断

public static boolean isChinese(String str) throws UnsupportedEncodingException
    {
        int len = str.length();
        for(int i = 0;i < len;i ++)
        {
            String temp = URLEncoder.encode(str.charAt(i) + "", "utf-8");
            if(temp.equals(str.charAt(i) + ""))
                continue;
            String[] codes = temp.split("%");
            //判断是中文还是字符(下面判断不精确,部分字符没有包括)
            for(String code:codes)
            {
                if(code.compareTo("40") > 0)
                    return true;
            }
        }
        return false;
    }

优缺点:        

缺点:效率低【每次都需要循环检测字符串中每个字符】(每次发送都需要检测短信内容,每条内容有很多字符);

优点:不仅能检测出中文汉字还能检测中中文标点;

方法2、利用正则表达式

public static boolean isContainChinese(String str) {
 
        Pattern p = Pattern.compile("[\u4e00-\u9fa5]");
        Matcher m = p.matcher(str);
        if (m.find()) {
            return true;
        }
        return false;
}

优缺点:        

缺点:只能检测出中文汉字不能检测中文标点;

优点:利用正则效率高;

方法3、改造正则

/**
  * 字符串是否包含中文
  *
  * @param str 待校验字符串
  * @return true 包含中文字符  false 不包含中文字符
  * @throws EmptyException
  */
 public static boolean isContainChinese(String str) throws EmptyException {
 
  if (StringUtils.isEmpty(str)) {
throw new EmptyException("sms context is empty!");
  }
  Pattern p = Pattern.compile("[\u4E00-\u9FA5|\\!|\\,|\\。|\\(|\\)|\\《|\\》|\\“|\\”|\\?|\\:|\\;|\\【|\\】]");
  Matcher m = p.matcher(str);
  if (m.find()) {
return true;
  }
  return false;
 }

优缺点:

优点:效率既高又能检测出中文汉字和中文标点;

缺点:目前尚未发现。

推荐学习:Java视频教程

以上がJavaは文字列に中国語の文字が含まれているかどうかを判断しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。