Java は、文字が漢字実装コードであるかどうかを判断します: (推奨 : Java ビデオ チュートリアル )
/** * 判断一个字符是否是汉字 * PS:中文汉字的编码范围:[\u4e00-\u9fa5] * * @param c 需要判断的字符 * @return 是汉字(true), 不是汉字(false) */ public static boolean isChineseChar(char c) { return String.valueOf(c).matches("[\u4e00-\u9fa5]"); }
例:
/** * 判断一个字符是否是汉字 * * @author Yawei Xi * @date 2018-8-20 */ public class Test { public static void main(String[] args) { char a = ' '; char b = 0; char c = 'a'; char d = '中'; System.out.println(isChineseChar(a)); System.out.println(isChineseChar(b)); System.out.println(isChineseChar(c)); System.out.println(isChineseChar(d)); } /** * 判断一个字符是否是汉字 * PS:中文汉字的编码范围:[\u4e00-\u9fa5] * * @param c 需要判断的字符 * @return 是汉字(true), 不是汉字(false) */ public static boolean isChineseChar(char c) { return String.valueOf(c).matches("[\u4e00-\u9fa5]"); } }
出力結果:
false false false true
Java は Unicode エンコードを使用しています。char 型変数の範囲は 0 ~ 65535 です。符号なしの値は 65536 文字を表現できます。基本的に地球上の文字です。
中国語文字は基本的に [19968, 40869] の間に集中し、合計 20901 文字になります
Unicode エンコード範囲:
中国語文字: [0x4e00, 0x9fa5] (または 10 進数 [19968,40869])
全角文字エンコーディング範囲
1.GBK (GB2312/GB18030)
/x00-/xff GBK double -バイトエンコード範囲
/x20-/x7f ASCII
/xa1-/xff 中国語 gb2312
/x80-/xff 中国語 gbk
2。 UTF-8 (Unicode)
/u4e00-/u9fa5 (中国語)
Java の詳細については、Java 基本チュートリアル 列に注目してください。
以上がJavaで文字が漢字かどうかを判断する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。