問題の説明
この記事へのリンク: http://www.hcoding.com/?p=130
初めて正規表現を学習するときに質問があります。たとえば、文字列「_abc_123_」の最初のペア「_」間の文字を一致させる必要がある場合、私は次のようにします。 「/_w*_ /」と書くと、一致結果は「abc」ではなく「abc_123」となり、マスターは疑問符「/_w*?_/」を追加すると言いました。この場合、一致結果は「abc」」になります。
知っていますか? ' を単独で使用する場合は、0 回または 1 回繰り返すことを意味します。一方、'? ' は繰り返し修飾子の後に表示され、その機能は遅延マッチング、つまり可能な限り少ない文字のマッチングです。遅延修飾子の説明:
優先度数量子を無視する
数量子「*?」、「+?」、「??」、「{n,m}?」、「{n,}?」はすべて無視される優先度数量子です。無視される優先度数量子は、?、+ で使用されます。 , * と {} の後に ? を追加することで構成されます。無視する優先度は、マッチング時に最初に無視を試行し、失敗した場合はバックトラックしてから試行することを選択します。たとえば、「ab??」が「abb」と一致する場合、「ab」ではなく「a」が取得されます。エンジンが a に一致すると、優先度を無視するため、エンジンは最初に b に一致しないことを選択し、式が終了していることが判明した場合は、一致が成功したことを直接報告します。具体的には、次の例を使用して、優先度数量詞を無視する動作原理を段階的に説明します。
例
上記の例と同様に、「
/_w*?_/
」を使用して、「_abc_123_」の最初の「_」のペア間の文字を一致させます。 最初の '_' の一致を開始した後、'w*?' は優先度数量子を無視するため、最初にどの文字とも一致する必要がないと判断します。このとき、式 '/_w*?_
/' 2 つの '_' ('w*?' の後の '_') は、ターゲット文字列 '_abc_123_' の 'a' と一致します。一致が失敗した場合、'w*?' が実行されます。一致しないブランチを試してください (w を使用して a を一致させ、正常に一致するようにしてください) 次のステップでは、一致させるべきでしょうか、それとも無視すべきでしょうか? 「w*?」は優先度数量子を無視するため、前のステップを繰り返しますが b に一致せず、「w*?」は上記のステップを繰り返した後、一致しない分岐 ab を試みます。 3 回 (式「w*?」の後の「_」がターゲット文字列の 2 番目の「_」と一致するまで)、最終的に「abc」が一致します。
プロセス (最初の「_」の一致を開始した後):
式 /_w*?
_この記事へのリンク: http://www.hcoding.com/?p=130
元の記事は、JC&hcoding.com と明記してください
上記は、正規表現 (遅延マッチング) についての私の個人的な理解をその側面も含めて紹介したもので、PHP チュートリアルに興味のある友人に役立つことを願っています。