C#에서 문자열을 분할할 때 구분 기호 보존
특정 구분 기호를 사용하여 문자열을 분할해야 하는 경우가 많지만 결과 배열에 해당 구분 기호를 유지하고 싶은 경우도 있습니다. 이 문서에서는 정규식을 사용하여 C#에서 안정적인 방법을 보여줍니다.
해결책: 정규 표현식
C#의 Regex.Split
메서드는 교묘하게 만들어진 정규 표현식과 결합되어 솔루션을 제공합니다. 핵심은 긍정적인 LookBehind 주장을 사용하는 것입니다. 긍정적인 뒤돌아보기는 일치 항목 자체에 해당 패턴을 포함하지 않고 현재 위치 이전에 패턴이 존재하도록 보장합니다.
정규 표현식 패턴:
이 패턴은 출력에 유지되면서 구분 기호(이 예에서는 쉼표, 마침표, 세미콜론)를 찾습니다.
<code class="language-csharp">(?<=(?:[,.;]))</code>
(?<=...)
: 긍정적인 LookBehind 주장입니다.(?:[,.;])
: 쉼표, 마침표, 세미콜론과 일치하는 비캡처 그룹입니다.코드 예:
코드로 설명해 보겠습니다.
<code class="language-csharp">using System.Text.RegularExpressions; // ... other code ... string originalString = "This,is,a,comma,separated,string."; string[] parts = Regex.Split(originalString, @"(?<=(?:[,.;]))"); // parts array will contain: // ["This",",","is",",","a",",","comma",",","separated",",","string","."] </code>
정규 표현식은 각 구분 기호 바로 다음 지점에서 문자열을 분할합니다. 구분 기호 자체는 일치 항목에 포함되지 않으므로 결과 배열에 보존됩니다.
출력:
출력에서는 원래 문자열이 분할되었으며 각 구분 기호가 결과 배열에 별도의 요소로 포함되었음을 보여줍니다. 긍정적인 뒤돌아보기는 구분 기호가 문자열 세그먼트에 흡수되지 않고 분할의 일부가 되도록 보장합니다.
위 내용은 구분 기호를 유지하면서 C#에서 문자열을 어떻게 분할할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!