Heim >Backend-Entwicklung >PHP-Tutorial >Detaillierte Einführung in PHP-PCRE-Rückverweise für reguläre Ausdrücke

Detaillierte Einführung in PHP-PCRE-Rückverweise für reguläre Ausdrücke

伊谢尔伦
伊谢尔伦Original
2017-03-30 15:03:221529Durchsuche

Außerhalb einer -Zeichenklasse ist ein Backslash, gefolgt von einer Zahl größer als 0 (und möglicherweise einer Ziffer), ein -Lookbehind zu einer einfangenden Gruppe, die zuvor im Muster Zitat vorkam .

Wenn die Zahl unmittelbar nach dem Backslash kleiner als 10 ist, handelt es sich immer um einen Rückverweis, und es wird ein Fehler ausgegeben, wenn das Muster nicht so viele einfangende Gruppen enthält. Mit anderen Worten: Die Anzahl der Klammern in Anführungszeichen darf nicht kleiner als 10 sein. Im Abschnitt „Backslashes“ oben erfahren Sie, wie mit Zahlen umgegangen wird.

Eine Rückreferenz stimmt direkt mit dem Inhalt überein, der tatsächlich von der referenzierten Erfassungsgruppe in der Ziel-Zeichenfolge erfasst wurde, und nicht mit dem Inhalt des Untergruppenmusters. Daher stimmen die Muster (sens|respons)e und 1ibility mit „Sinn und Sensibilität“ und „Reaktion und Verantwortung“ überein, nicht jedoch mit „Sinn und Verantwortung“. Wenn für die Rückreferenz eine Übereinstimmung zwischen Groß- und Kleinschreibung erzwungen wird, stimmt beispielsweise ((?i)rah)s 1 mit „rah rah“ und „RAH RAH“ überein, aber nicht mit „RAH rah“, selbst wenn es sich um die ursprüngliche einfangende Untergruppe handelt Die Groß-/Kleinschreibung wird nicht beachtet. Anmerkung: Hier muss berücksichtigt werden, dass der von der Rückwärtsreferenz erwartete Inhalt genau mit dem von der referenzierten Erfassungsuntergruppe erhaltenen Inhalt übereinstimmt (natürlich können wir ihn nicht unterscheidbar machen, indem wir interne Optionen vor der Rückwärtsreferenz festlegen). Groß- und Kleinschreibung wird nicht beachtet kann auch durch Ändern der Groß-/Kleinschreibung oder Hinzufügen von Modusmodifikatoren erreicht werden. Dieser Ansatz steuert jedoch tatsächlich sein Verhaltenvon außen)

Möglicherweise gibt es mehr als eine Rückreferenz, die sich auf dasselbe bezieht Untergruppe. Eine Untergruppe wird möglicherweise nicht tatsächlich für eine bestimmte Übereinstimmung verwendet. In diesem Fall schlagen alle Rückverweise auf die Untergruppe fehl. Beispielsweise schlägt das Muster (a|(bc))2 immer fehl, wenn Zeichenfolgen gefunden werden, die mit „a“, aber nicht mit „bc“ beginnen. Da es bis zu 99 Rückverweise geben kann, kann jede Zahl, die unmittelbar auf den Backslash folgt, eine potenzielle Rückverweisanzahl darstellen. Wenn dem Muster unmittelbar nach dem Rückverweis ein numerisches Zeichen folgt, muss ein Trennzeichen verwendet werden, um die Rückverweissyntax zu beenden. Dies kann mithilfe von Leerzeichen erfolgen, wenn die Option PCRE_EXTENDED gesetzt ist. In anderen Fällen kann ein leerer Kommentar verwendet werden.

Wenn eine Rückreferenz innerhalb der Untergruppe erscheint, auf die sie verweist, schlägt die Übereinstimmung fehl. Beispielsweise erhält (a1) keine Übereinstimmungen. Diese Referenz kann jedoch für die interne Wiederholung von Untermustern verwendet werden. Beispielsweise entspricht das Muster (a|b1) einer beliebigen Anzahl von „a“-Zeichenfolgen sowie „aba“, „ababba“ usw. (Anmerkung: Da es einen optionalen Pfad innerhalb der Untergruppe gibt, gibt es einen Pfad in Der optionale Pfad kann abgeschlossen werden. Nachdem der Abgleich abgeschlossen ist, kann der Rückverweis auf den Inhalt verweisen. Bei jeder Iteration des Untermusters stimmt die Rückreferenz mit der Zeichenfolge überein, mit der die Untergruppe während der vorherigen Iteration übereinstimmte. Um diese Arbeit zu erledigen, muss das Muster die Bedingung erfüllen, dass das Muster garantieren kann, dass bei der ersten Iteration keine Rückverweise abgeglichen werden müssen. Diese Bedingung kann mithilfe eines optionalen Pfads wie im obigen Beispiel oder durch Ändern der Rückreferenz mithilfe eines Quantifizierers mit einem Mindestwert von 0 implementiert werden.

Ab PHP 5.2.2 kann die g-Escape-Sequenz sowohl für absolute als auch relative Referenzen auf Untermuster verwendet werden. Auf diese Escape-Sequenz muss eine vorzeichenlose oder eine negative Zahl folgen, optional in Klammern eingeschlossen. Es besteht eine Synonymbeziehung zwischen Sequenz 1, g1 und g{1}. Diese Verwendung beseitigt die Mehrdeutigkeit, die durch die Verwendung eines Backslashs gefolgt von einem numerischen Wert zur Beschreibung einer Rückreferenz entsteht. Diese Escape-Sequenz hilft dabei, Rückverweise von oktalen Ziffern zu unterscheiden und macht außerdem klarer, dass auf einen Rückverweis eine mit der Quelle übereinstimmende Ziffer folgt, wie z. B. g{2}1.

g Die Escape-Sequenz gefolgt von einer negativen Zahl stellt eine relative Rückreferenz dar. Beispiel: (foo)(bar)g{-1} kann mit der Zeichenfolge „foobarbar“ übereinstimmen, (foo)(bar)g{2} kann mit „foobarfoo“ übereinstimmen. Dies wird im Langmodus als Option verwendet, um die Untergruppensequenznummer eines vorherigen Verweises auf eine bestimmte Untergruppe zu verfolgen.

Rückwärtsreferenzen unterstützen auch die Syntaxbeschreibung mithilfe von Untergruppennamen, z. B. (?P=name) oder ab PHP 5.2.2 können k verwendet werden. Darüber hinaus wurde in PHP 5.2.4 Unterstützung für k{name} und g{name} hinzugefügt.

Das Obige ist eine detaillierte Einführung in die Rückreferenzierung regulärer PHP-PCRE-Ausdrücke. Weitere verwandte Inhalte finden Sie auf der chinesischen PHP-Website (www.php.cn).

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn