ホームページ  >  記事  >  Java  >  Java で印刷できない Unicode 文字を置き換える方法は?

Java で印刷できない Unicode 文字を置き換える方法は?

Barbara Streisand
Barbara Streisandオリジナル
2024-11-01 08:37:02135ブラウズ

How to Replace Non-Printable Unicode Characters in Java?

Java での印刷不可能な Unicode 文字の置換

Java では、提供された正規表現パターンで ASCII 制御文字と印刷不可能な文字を置き換えることができます。ただし、Unicode 文字列を効果的に処理できません。

Unicode 用の拡張正規表現パターン

この制限に対処するために、Unicode をターゲットとする変更されたパターンを使用できます。カテゴリ「その他」:

<code class="java">my_string.replaceAll("\p{C}", "?");</code>

カテゴリ「その他」(\p{C}) には、制御文字、フォーマット文字、サロゲート コード ポイントなど、幅広い印刷不可能な文字が含まれます。このパターンは、これらの文字を Unicode 文字列から効果的に削除します。

追加情報

より包括的な理解のために、Java で使用可能な Unicode 正規表現を調べることをお勧めします。 util.regexPattern/String.replaceAll のサポート。これらの式は、Unicode 文字列を操作および変更するための堅牢なメカニズムを提供します。

以上がJava で印刷できない Unicode 文字を置き換える方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。