>백엔드 개발 >C++ >C#의 문자열에서 ASCII가 아닌 문자를 어떻게 제거할 수 있습니까?

C#의 문자열에서 ASCII가 아닌 문자를 어떻게 제거할 수 있습니까?

Linda Hamilton
Linda Hamilton원래의
2025-01-19 13:27:10142검색

How Can I Remove Non-ASCII Characters from a String in C#?

C# 문자열에서 비ASCII 문자를 효율적으로 제거

데이터 처리에는 종종 문자열 정리가 필요하며, 특히 레거시 시스템 호환성의 경우 ASCII가 아닌 문자를 제거하는 것이 일반적인 작업입니다. C#은 정규식을 사용하여 간단한 솔루션을 제공합니다.

정규표현식 접근

ASCII가 아닌 문자를 제거하는 가장 효율적인 방법은 Regex.Replace 방법을 사용하는 것입니다. 방법은 다음과 같습니다.

<code class="language-csharp">string inputString = "søme string with non-ASCII characters.";
string cleanString = Regex.Replace(inputString, @"[^\u0000-\u007F]+", "");</code>

정규식 이해

정규식을 분석해 보겠습니다 [^u0000-u007F] :

  • [^...]: 이것은 부정된 문자 클래스입니다. 이는 "괄호 안에 없는 모든 문자와 일치합니다."
  • 를 의미합니다.
  • u0000-u007F: ASCII 문자(10진수 0-127)에 대한 유니코드 범위를 지정합니다.

따라서 전체 표현식은 ASCII 범위를 벗어나는 하나 이상의 ( ) 문자와 일치합니다.

방법설명

Regex.Replace 메서드는 inputString에서 비ASCII 문자 시퀀스를 체계적으로 검색하고 이를 빈 문자열("")로 대체하여 효과적으로 제거합니다. 결과 cleanString에는 ASCII 문자만 포함됩니다.

위 내용은 C#의 문자열에서 ASCII가 아닌 문자를 어떻게 제거할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.