Heim  >  Artikel  >  Backend-Entwicklung  >  Zusammenfassung der Zeichen regulärer Ausdrücke

Zusammenfassung der Zeichen regulärer Ausdrücke

小云云
小云云Original
2018-02-22 13:14:031457Durchsuche

Der grundlegende reguläre Ausdruck

entspricht einem einzelnen Zeichen.

entspricht einer einzelnen Zahl, die „[0-9]“ oder „d“ sein kann.

entspricht einem einzelnen nicht numerischen Zeichen , dann verwenden Sie Großbuchstaben „D“.

entspricht einem beliebigen der 26 Buchstaben , verwenden Sie „[a-zA-Z]

, um ein beliebiges Zeichen zu finden, verwenden Sie den Punkt „.

Wenn Sie bestimmte Zeichen finden, schreiben Sie sie einfach direkt. Beispielsweise stimmt „abcd“ mit sich selbst überein. Wenn Sie auf Sonderzeichen stoßen, müssen Sie als Escape-Zeichen verwenden. Das Escape-Zeichen ist „“.

entspricht einem Zeichen. Die Verwendung von eckigen Klammern wird als „Zeichensatz“ bezeichnet. Eckige Klammern werden verwendet, um einen „Satz“ anzugeben, der einem Zeichen in diesem Satz entspricht, beispielsweise der Hexadezimalzahl „[0-9a-fA-F]“. Der Punkt im Zeichensatz stellt den Punkt selbst dar, es müssen aber noch weitere Sonderzeichen übertragen werden, wie zum Beispiel Backslash-Zeichen.

Quantoren verwenden

Greedy Matching

Wenn Sie die Wiederholung einer Regel ausdrücken möchten, müssen Sie Quantoren verwenden. Verwenden Sie geschweifte Klammern, um die Anzahl der Wiederholungen anzugeben. Beispielsweise können 8 Zahlen wie folgt ausgedrückt werden: „d{8}

Die Quantoren in den geschweiften Klammern können geändert werden. Um beispielsweise 7 bis 8 Zahlen auszudrücken, wird dies als „d{7,8}“ ausgedrückt ". Der R-Wert, der die Obergrenze darstellt, muss nicht geschrieben werden. Beispielsweise ist „{0,}“ zulässig und gibt an, dass er größer oder gleich 0 Zeichen ist. „{,10}“ versucht jedoch, nur die Obergrenze auszudrücken ist nicht legal und sollte zumindest als „{0,10}“ geschrieben werden.

Das Pluszeichen „+“ gibt an, dass die Anzahl der Elemente links davon „eins oder mehrere“ beträgt, was dem Effekt von „{1,}“ entspricht. Das Pluszeichen ist also auch ein Sonderzeichen.

Das Sternchen „*“ gibt an, dass die Anzahl der Elemente links davon „null oder mindestens eins“ ist, also „{0,}“.

Das Fragezeichen „?“ bedeutet „null oder eins“ und ist äquivalent zu „{0,1}“.

Lazy Matching

Für die oben genannten, wie + und *, wird beim Matching das Muster „gierig“ verwendet, d. h. Matching als viele Artikel wie möglich. Wenn Sie beispielsweise „5+“ verwenden, um die Zeichenfolge „55555“ abzugleichen, wird die längste Zeichenfolge gefunden, die gefunden werden kann, nämlich „55555“.

Wenn Sie nach dem Quantifizierer ein Fragezeichen hinzufügen, wird das Übereinstimmungsmuster zu „faul“, also zu dem Muster mit der geringsten Übereinstimmung. Wenn Sie beispielsweise „5+?“ zum Abgleichen verwenden, finden Sie nur das kleinste passende Zeichen „5“. > ,

+?Erfassungsgruppierung (ähnlich der Makrodefinition) *?{n,}? kann einen Teil des Ausdrucks {m,n}? "erfassen"

und ihn später als Makro referenzieren. Verwenden Sie

-Klammern

, um (Erfassung) zu definieren, und verwenden Sie dann „

“ nach der Definition, um darauf zu verweisen. Wenn es sich um die zweite Erfassung handelt, verwenden Sie „“ und so weiter. Gruppen werden im Allgemeinen gespeichert. Wenn der Ausdruck jedoch sehr lang ist, kann es erforderlich sein, ausdrücklich anzugeben, dass die Gruppe nicht gespeichert werden soll. Wenn Sie beispielsweise das Format „“ verwenden, verwenden Sie die Bezeichnung „1“, um anzugeben, dass keine Namens-Tags erforderlich sind. 2

„ODER“-Logik

(?:THE|The|the)Verwenden Sie „?:“, um zwei Felder zu verknüpfen und so eine „ODER“-Logik bereitzustellen. Beachten Sie, dass es mit Klammern

„nicht“-Logik

verwendet wird. Wenn das Zeichen „|“ im Satz „

“ verwendet wird, bedeutet es „nicht“, wie z „

“ Entspricht „

“.

[...]^[^0-9]D

Einfacher Mustervergleich Zusammenfassung der Zeichen regulärer AusdrückeIm Folgenden finden Sie eine Liste häufig verwendeter Einzelzeichenübereinstimmungen:

Zahlen
Referenztyp Muster Bemerkungen

Buchstaben, Zahlen, Unterstriche w Entspricht „[_a-zA-Z0-9]
Keine Zahlen

Nicht-Buchstaben W code >
Tabulatorzeichen Tab t
指代类型 模式 备注
数字 d
字母、数字、下划线 w 等效于 “[_a-zA-Z0-9]
非数字 D
非字母 W
制表符 Tab t
Null 字符

Das obige ist der detaillierte Inhalt vonZusammenfassung der Zeichen regulärer Ausdrücke. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn