C# 文字列内の非 ASCII 文字を効率的に削除する
データ クリーニングでは、多くの場合、文字列から非 ASCII 文字を削除する必要があります。 C# の Regex.Replace
メソッドは、この一般的なタスクに対する簡潔なソリューションを提供します。
例:
<code class="language-csharp">string inputString = "søme string with non-ASCII characters."; string outputString = Regex.Replace(inputString, @"[^\u0000-\u007F]+", "");</code>
正規表現の内訳:
正規表現 [^u0000-u007F]
は、ASCII 範囲外のすべての文字をターゲットにして削除します。細かく見てみましょう:
[^...]
: これは否定された文字クラスです。 指定されたセット内にない任意の文字と一致します。u0000-u007F
: ASCII 文字の範囲 (Unicode コード ポイント 0 ~ 127) を定義します。
: この数量子は、1 つ以上の連続する非 ASCII 文字が一致して置換されることを保証します。一致した文字を空の文字列 (""
) に置き換えると、元の文字列から効果的に削除されます。 このアプローチは、C# で非 ASCII 文字の削除を処理するクリーンで効率的な方法を提供します。
以上がC# の文字列から非 ASCII 文字を削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。