ホームページ >Java >&#&チュートリアル >Java で Unicode 文字を英語のアルファベットに変換するにはどうすればよいですか?

Java で Unicode 文字を英語のアルファベットに変換するにはどうすればよいですか?

Linda Hamilton
Linda Hamiltonオリジナル
2024-11-12 09:46:02230ブラウズ

How to Convert Unicode Characters to the English Alphabet in Java?

Unicode 文字から英語のアルファベットへの変換

何千もの文字を自由に使える広大な Unicode の領域では、私たちはしばしば課題に直面します。類似した文字を対応する英語のアルファベットに変換します。 🎜>

Java でこの問題に対処するには、Normalizer クラスを利用して必要な変換を実行できます。 。 Normalizer.normalize() メソッドは文字列を受け入れ、目的の正規化形式、具体的には Normalizer.Form.NFD (正規化形式正規分解) を適用します。

文字列が正規化されたら、正規表現を使用して取り除くことができます。アクセント付き文字を基本文字と区別する結合発音記号。次の Java コードは、このアプローチを示しています。

import java.text.Normalizer;
import java.util.regex.Pattern;

public class UnicodeConverter {

    public static String deAccent(String str) {
        String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD); 
        Pattern pattern = Pattern.compile("\p{InCombiningDiacriticalMarks}+");
        return pattern.matcher(nfdNormalizedString).replaceAll("");
    }

    public static void main(String[] args) {
        String accentedText = "tђє Ŧค๓เℓy";
        System.out.println(deAccent(accentedText)); // Output: the Family
    }
}
この技術を利用すると、広範囲のアクセント付き文字を対応する英語のアルファベット表現に効果的に変換でき、シームレスなテキスト処理と操作タスクが可能になります。

以上がJava で Unicode 文字を英語のアルファベットに変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。