在Java 中取代不可列印的Unicode 字元
在Java 中,提供的正規表示式模式可以取代ASCII 控制和不可列印字元。然而,它們無法有效地處理 Unicode 字串。
Unicode 的增強正規表示式模式
為了解決此限制,可以採用針對Unicode 的修改後的模式「其他」類別:
<code class="java">my_string.replaceAll("\p{C}", "?");</code>
「其他」類別(\p{C}) 包含各種不可列印字符,包括控製字符、格式字符和代理代碼點。此模式有效地從 Unicode 字串中刪除這些字元。
其他資訊
為了更全面地理解,建議探索 java.lang.String 中可用的 Unicode 正規表示式。 util.regexPattern/String.replaceAll 支援。這些表達式提供了用於操作和修改 Unicode 字串的強大機制。
以上是如何在 Java 中替換不可列印的 Unicode 字元?的詳細內容。更多資訊請關注PHP中文網其他相關文章!