Unicode でエンコードされた文字列を文字列に変換する
このプログラミング パズルでは、エスケープされた Unicode 文字 ( uXXXX) を実際の Unicode 文字の文字列に変換します。
この問題を説明するには、文字列「u0048u0065u006Cu006Cu006F ワールド」。通常、この文字列は印刷時に「Hello World」と表示されます。ただし、ファイルからファイル名を読み取るときに問題が発生します。エスケープされた Unicode エンコードで保存されたファイル名は、検索中に認識されない場合があります。
この問題を解決するには、Apache Commons Lang ライブラリを利用できます。その StringEscapeUtils は、Unicode でエンコードされた文字列をそれぞれの文字に効果的にデコードできる unescapeJava() というメソッドを提供します。
解決策:
import org.apache.commons.lang.StringEscapeUtils; @Test public void testUnescapeJava() { String sJava="\u0048\u0065\u006C\u006C\u006F"; System.out.println("StringEscapeUtils.unescapeJava(sJava):\n" + StringEscapeUtils.unescapeJava(sJava)); }
出力:
StringEscapeUtils.unescapeJava(sJava): Hello
StringEscapeUtils クラスを利用すると、次のことができます。 Unicode でエンコードされた文字列を通常の Unicode 文字の文字列に正常に変換し、効率的なファイルを作成できるようにしました。名前検索操作。
以上がJava でエスケープされた Unicode 文字列を通常の Unicode 文字に変換する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。