ホームページ >バックエンド開発 >C++ >C# の文字列から非 ASCII 文字を削除するにはどうすればよいですか?

C# の文字列から非 ASCII 文字を削除するにはどうすればよいですか?

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2025-01-19 13:16:09420ブラウズ

How to Remove Non-ASCII Characters from Strings in C#?

C# 文字列内の非 ASCII 文字を効率的に削除する

データ クリーニングでは、多くの場合、文字列から非 ASCII 文字を削除する必要があります。 C# の Regex.Replace メソッドは、この一般的なタスクに対する簡潔なソリューションを提供します。

例:

<code class="language-csharp">string inputString = "søme string with non-ASCII characters.";
string outputString = Regex.Replace(inputString, @"[^\u0000-\u007F]+", "");</code>

正規表現の内訳:

正規表現 [^u0000-u007F] は、ASCII 範囲外のすべての文字をターゲットにして削除します。細かく見てみましょう:

  • [^...]: これは否定された文字クラスです。 指定されたセット内にない任意の文字と一致します。
  • u0000-u007F: ASCII 文字の範囲 (Unicode コード ポイント 0 ~ 127) を定義します。
  • : この数量子は、1 つ以上の連続する非 ASCII 文字が一致して置換されることを保証します。

一致した文字を空の文字列 ("") に置き換えると、元の文字列から効果的に削除されます。 このアプローチは、C# で非 ASCII 文字の削除を処理するクリーンで効率的な方法を提供します。

以上がC# の文字列から非 ASCII 文字を削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。