Unicode でエンコードされた文字列を Unicode 文字に変換する
テキスト データを操作する場合、エスケープされた Unicode 文字を含む文字列に遭遇することがよくあります。 「uXXXX」として表されるこれらの文字により、テキストを効果的に検索して操作することが困難になる場合があります。この記事では、Apache Commons Lang ライブラリを使用して、このような Unicode でエンコードされた文字列を通常の Unicode 文字に変換する方法について説明します。
例を考えてみましょう。Unicode 文字を含む文字列「u0048u0065u006Cu006Cu006F World」があります。私たちの目標は、この文字列を対応する Unicode 文字に変換し、「Hello World」を生成することです。
この問題を解決するには、Apache Commons Lang ライブラリの unescapeJava() メソッドを利用できます。このメソッドは、Java エスケープされた Unicode 文字をデコードするように特別に設計されています。
このメソッドの使用方法を示すコード例を次に示します。
import org.apache.commons.lang.StringEscapeUtils; public class UnicodeConverter { public static void main(String[] args) { String escapedString = "\u0048\u0065\u006C\u006C\u006F World"; String unescapedString = StringEscapeUtils.unescapeJava(escapedString); System.out.println("Escaped string: " + escapedString); System.out.println("Unescaped string: " + unescapedString); } }
出力:
Escaped string: \u0048\u0065\u006C\u006C\u006F World Unescaped string: Hello World
StringEscapeUtils.unescapeJava() メソッドを利用すると、Unicode でエンコードされた文字列を対応する文字列に簡単に変換できます。ユニコード文字。これにより、検索や比較操作など、より効率的なテキスト処理が可能になります。
以上がJava エスケープされた Unicode 文字列を通常の Unicode 文字に変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。