高效率刪除 C# 字串中的非 ASCII 字元
資料處理通常需要清理字串,而刪除非 ASCII 字元是一項常見任務,特別是對於舊系統相容性而言。 C# 使用正規表示式提供了一個簡單的解決方案。
正規表示式方法
消除非 ASCII 字元的最有效方法是透過 Regex.Replace
方法。 方法如下:
<code class="language-csharp">string inputString = "søme string with non-ASCII characters."; string cleanString = Regex.Replace(inputString, @"[^\u0000-\u007F]+", "");</code>
理解正規表示式
讓我們來剖析正規表示式[^u0000-u007F]
:
[^...]
:這是一個否定的字元類別。它的意思是「匹配括號內不是的任何字元。」u0000-u007F
:指定 ASCII 字元的 Unicode 範圍(十進位 0-127)。 因此,整個表達式會匹配一個或多個 (
) 超出 ASCII 範圍的字元。
方法說明
Regex.Replace
方法系統地搜尋 inputString
中的任何非 ASCII 字元序列,並將其替換為空字串 (""
),從而有效地刪除它們。 產生的 cleanString
僅包含 ASCII 字元。
以上是如何從 C# 字串中刪除非 ASCII 字元?的詳細內容。更多資訊請關注PHP中文網其他相關文章!