String.replaceAll(regex)이 모든 항목과 일치하는 정규 표현식에 대해 여러 대체를 수행하는 이유
Java에서 String.replaceAll() 메서드는 다음을 허용합니다. 정규식 패턴의 모든 항목을 지정된 대체 항목으로 대체합니다. 그러나 정규 표현식이 전체 입력 문자열과 일치하면 예기치 않은 동작이 발생하여 여러 번 대체될 수 있습니다.
제시된 예를 고려하세요.
<code class="java">System.out.println("test".replaceAll(".*", "a"));</code>
이 코드는 대신 "aa"를 출력합니다. 예상되는 "a"의. 이 예외 현상은 정규식 .*가 빈 문자열을 포함하여 모든 문자열과 일치하기 때문에 발생합니다.
초기 일치 후 정규식 엔진은 문자열의 끝부터 시작하여 다른 항목을 찾으려고 시도합니다. 입력. 그러나 .*는 빈 문자열과 일치할 수 있으며 이 일치는 입력의 맨 끝에서 발생합니다. 따라서 정규식 엔진은 이 빈 위치에서 "a"를 대체합니다.
이러한 동작을 방지하고 단일 대체를 보장하려면 대신 .* 표현식을 사용하는 것이 좋습니다. 이 경우 정규 표현식이 최소한 하나의 문자와 일치해야 합니다. 따라서 빈 문자열과 일치할 수 없습니다.
또는 지정된 정규식의 첫 번째 항목만 바꾸는 String.replaceFirst() 메서드를 사용할 수 있습니다.
예:
<code class="java">"test".replaceFirst(".*", "a")</code>
이 코드는 원하는 "a" 출력을 생성합니다.
모든 정규식 엔진이 여러 일치 항목에 대해 동일한 방식으로 작동하는 것은 아니라는 점을 언급할 가치가 있습니다. 예를 들어, GNU sed는 첫 번째 일치 후 입력이 소진된 것으로 간주하여 추가 교체를 방지합니다.
위 내용은 정규식이 모든 항목과 일치할 때 `String.replaceAll(regex)`가 여러 교체를 수행하는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!