Javaで文字列が中国語かどうかを判断する方法-＆＃＆ベース-php.cn

ホームページ

Java

＆＃＆ベース

Javaで文字列が中国語かどうかを判断する方法

尚

Nov 22, 2019 am 09:28 AM

java

Javaで文字列が中国語かどうかを判断する方法

Java は Unicode エンコーディングを使用します。char 型変数の範囲は 0 ～ 65535 です。符号なしの値は 65536 文字を表すことができます。基本的に、地球上のすべての文字を含めることができます。

漢字は基本的に [19968, 40869] の間に集中しており、合計 20901 文字になります。

Unicode エンコード範囲:

中国語文字: [0x4e00,0x9fa5] (または 10 進数 [19968,40869])

数値: [0x30,0x39] (または 10 進数 [ 48 , 57])

小文字: [0x61,0x7a] (または 10 進数 [97, 122])

大文字: [0x41,0x5a] (または 10 進数 [65, 90]) )

最初の方法は、中国語の文字があるかどうかを判断することです

public boolean checkcountname(String countname)
    {
         Pattern p = Pattern.compile("[\u4e00-\u9fa5]");
            Matcher m = p.matcher(countname);
            if (m.find()) {
                return true;
            }
            return false;
    }

正規表現を使用して照合します

2 番目の方法は、文字列全体が中国語で構成されているかどうかを判断することです文字

public boolean checkname(String name)
    {
        int n = 0;
        for(int i = 0; i < name.length(); i++) {
            n = (int)name.charAt(i);
            if(!(19968 <= n && n <40869)) {
                return false;
            }
        }
        return true;
    }

Java の詳細については、Java 基本チュートリアルを参照してください。

以上がJavaで文字列が中国語かどうかを判断する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。