Heim  >  Artikel  >  Java  >  Was ist die Java-Syntax für reguläre Ausdrücke?

Was ist die Java-Syntax für reguläre Ausdrücke?

小老鼠
小老鼠Original
2023-12-25 15:35:02837Durchsuche

Die grundlegende Syntax regulärer Java-Ausdrücke umfasst Metazeichen, vordefinierte Muster, Zeichenklassen, Quantifizierermodifikatoren, Escapezeichen, Gruppierung, nicht erfassende Gruppierung, Look-Ahead-Behauptungen, benannte Erfassungsgruppen, Rückwärtsverweise usw. Detaillierte Einführung: 1. Metazeichen: „.“: entspricht jedem einzelnen Zeichen (außer Newline); „$“: entspricht dem Ende der Eingabezeichenfolge; Vorheriger Unterausdruck null oder mehrmals; „+“: entspricht dem vorherigen Unterausdruck einmal oder mehrmals; „?“: entspricht dem vorherigen Unterausdruck null oder einmal usw.

Was ist die Java-Syntax für reguläre Ausdrücke?

Das Betriebssystem dieses Tutorials: Windows 10-System, Dell G3-Computer.

Java Regular Expression (Regulärer Ausdruck) ist ein leistungsstarkes Textverarbeitungstool, das bestimmte Muster verwendet, um Text abzugleichen, zu finden oder zu bearbeiten. Hier ist einige grundlegende Syntax für reguläre Java-Ausdrücke:

  1. Metazeichen:

    • .: Entspricht jedem einzelnen Zeichen (außer Zeilenumbruch).
    • ^: Passen Sie die Startposition der Eingabezeichenfolge an.
    • $: Entspricht der Endposition der Eingabezeichenfolge.
    • *: Entspricht dem vorherigen Unterausdruck nullmal oder mehrmals.
    • +: Passen Sie den vorherigen Unterausdruck einmal oder mehrmals an.
    • ?: Übereinstimmung mit dem vorherigen Unterausdruck null oder einmal.
    • {n}: n ist eine nicht negative ganze Zahl. Übereinstimmung n-mal ermittelt.
    • {n,}: n ist eine nicht negative ganze Zahl. Passt mindestens n-mal zusammen.
    • {n,m}: m und n sind beide nicht negative ganze Zahlen, wobei n
    • d: Entspricht einem numerischen Zeichen. Entspricht [0-9].
    • D: Entspricht einem nicht numerischen Zeichen. Entspricht [^0-9].
    • s: Entspricht allen Leerzeichen, einschließlich Leerzeichen, Tabulatoren, Formularfeeds usw. Entspricht [fnrtv].
    • S: Entspricht jedem Zeichen, das kein Leerzeichen ist. Entspricht [^fnrtv].
    • w: Entspricht jedem Buchstaben, jeder Zahl oder jedem Unterstrich, einschließlich eines Unterstrichs. Entspricht „[A-Za-z0-9_]“.
    • W: Entspricht jedem Nicht-Wort-Zeichen. Entspricht '[^A-Za-z0-9_]'.
  2. Vordefinierte Muster:

    • ^$: Leere Zeile (nur bestehend aus Leerzeichen).
    • .: Jedes einzelne Zeichen (außer Zeilenumbruch).
    • n: Newline-Zeichen.
    • r: Wagenrücklaufzeichen.
    • t: Tabulatorzeichen.
  3. Zeichenklasse:

    • []: Zeichensatz wie [abc] passt zu jedem Zeichen in a, b oder c.
    • [^]: Ein negativer Zeichensatz wie [^abc] passt zu jedem Zeichen außer a, b, c.
  4. Modifikatoren von Quantoren:

    • ?: Das vorherige Zeichen oder Unterausdruck kommt 0 oder 1 Mal vor.
    • *: Das vorherige Zeichen oder der vorherige Unterausdruck erscheint 0 oder öfter.
    • +: Das vorherige Zeichen oder der vorherige Unterausdruck kommt mindestens einmal vor.
    • {n}: n ist eine nicht negative ganze Zahl und das vorherige Zeichen oder Unterausdruck kommt genau n-mal vor.
    • {n,}: n ist eine nicht negative ganze Zahl und das vorherige Zeichen oder Unterausdruck kommt mindestens n-mal vor.
    • {n,m}: m und n sind beide nicht negative ganze Zahlen, wobei n
  5. Escape: Verwenden Sie Backslash (), um Sonderzeichen zu maskieren, was beispielsweise bedeutet, dass sie mit dem tatsächlichen Punktzeichen anstelle des Sonderzeichens übereinstimmen.

  6. Gruppierung: Verwenden Sie Klammern zum Gruppieren, zum Beispiel bedeutet (ab)*, dass „ab“ null oder mehrmals gefunden wird.

  7. Nicht erfassende Gruppierung: Verwenden Sie Klammern und ein Fragezeichen davor, um eine nicht erfassende Gruppierung zu implementieren. (?:ab)* bedeutet beispielsweise, dass „ab“ null oder mehrmals gefunden wird, der Gruppierungsinhalt jedoch nicht erfasst wird.

  8. Look-Ahead-Behauptung: Verwenden Sie (?=...) und (?!...), um eine Look-Ahead-Behauptung zu erstellen. (?=abc) bedeutet beispielsweise, dass die Zeichenfolge, die folgen muss, „ ist. abc“ und (? !abc) bedeutet, dass die unmittelbar folgende Zeichenfolge nicht „abc“ sein darf.

  9. Benannte Erfassungsgruppe: Verwenden Sie (?...), um eine benannte Erfassungsgruppe zu definieren. (?202[0-9]{2}) bedeutet beispielsweise einen Abgleich zwischen 2020 und 2029 Jahr und erfassen Sie es als Gruppe mit dem Namen „Jahr“.

  10. Rückverweis: Verwenden Sie n (wobei n eine positive ganze Zahl ist), um einen Rückverweis zu erstellen und auf den übereinstimmenden Inhalt der n-ten Erfassungsgruppe zu verweisen, beispielsweise auf dasselbe Zeichen, das in der Musterzeichenfolge zweimal hintereinander vorkommt Beispielsweise kann das gleiche Zeichen, das in der Musterzeichenfolge zweimal hintereinander vorkommt, durch eine Rückreferenz dargestellt werden. Beispielsweise kann das gleiche Zeichen, das in der Musterzeichenfolge zweimal hintereinander vorkommt, durch a dargestellt werden Rückverweis.

Das obige ist der detaillierte Inhalt vonWas ist die Java-Syntax für reguläre Ausdrücke?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn