Warum String.replaceAll(regex) zweimal ersetzt
Im Codeausschnitt:
System.out.println("test".replaceAll(".*", "a"));
der reguläre Ausdruck .* entspricht jedem Zeichen, einschließlich Nullzeichen. Dies bedeutet, dass die gesamte Zeichenfolge zweimal gefunden werden kann:
- Während des ersten Durchgangs stimmt .* mit der gesamten Zeichenfolge überein und ersetzt sie durch „a“.
- Während des zweiten Durchgangs .* entspricht einer leeren Zeichenfolge am Ende der Eingabe (da sie mit null Zeichen übereinstimmen kann) und ersetzt sie durch ein anderes „a“.
Dieses Verhalten wird nicht als Fehler in der Java-Regex-Engine angesehen . Stattdessen ist es eine Folge der Art und Weise, wie .* mit jedem Zeichen übereinstimmt.
Alternativen
Um dieses Verhalten zu vermeiden, können Sie die folgenden Alternativen verwenden:
- Verwenden Sie .replaceFirst(), um nur das erste Vorkommen zu ersetzen:
"test".replaceFirst(".*", "a")
- Verwenden Sie .matches(), um zu überprüfen, ob die gesamte Zeichenfolge mit dem angegebenen regulären Ausdruck übereinstimmt:
System.out.println("test".matches(".*")); // Prints true
- Verwenden Sie einen spezifischeren regulären Ausdruck, z. B. . was mindestens ein Zeichen erfordert:
System.out.println("test".replaceAll(".+", "a")); // Prints a
Das obige ist der detaillierte Inhalt vonWarum ersetzt String.replaceAll(regex) zweimal, wenn \'.*\' verwendet wird?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!
Stellungnahme:Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn