首頁 >後端開發 >C++ >如何從 C# 字串中刪除非 ASCII 字元?

如何從 C# 字串中刪除非 ASCII 字元?

Linda Hamilton
Linda Hamilton原創
2025-01-19 13:27:10146瀏覽

How Can I Remove Non-ASCII Characters from a String in C#?

高效率刪除 C# 字串中的非 ASCII 字元

資料處理通常需要清理字串,而刪除非 ASCII 字元是一項常見任務,特別是對於舊系統相容性而言。 C# 使用正規表示式提供了一個簡單的解決方案。

正規表示式方法

消除非 ASCII 字元的最有效方法是透過 Regex.Replace 方法。 方法如下:

<code class="language-csharp">string inputString = "søme string with non-ASCII characters.";
string cleanString = Regex.Replace(inputString, @"[^\u0000-\u007F]+", "");</code>

理解正規表示式

讓我們來剖析正規表示式[^u0000-u007F] :

  • [^...]:這是一個否定的字元類別。它的意思是「匹配括號內不是的任何字元。」
  • u0000-u007F:指定 ASCII 字元的 Unicode 範圍(十進位 0-127)。

因此,整個表達式會匹配一個或多個 ( ) 超出 ASCII 範圍的字元。

方法說明

Regex.Replace 方法系統地搜尋 inputString 中的任何非 ASCII 字元序列,並將其替換為空字串 (""),從而有效地刪除它們。 產生的 cleanString 僅包含 ASCII 字元。

以上是如何從 C# 字串中刪除非 ASCII 字元?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn