ホームページ  >  記事  >  バックエンド開発  >  正規表現システムチュートリアル(5)_PHPチュートリアル

正規表現システムチュートリアル(5)_PHPチュートリアル

WBOY
WBOYオリジナル
2016-07-13 17:20:47982ブラウズ

5. すべての記号の説明

直前の部分式と 0 回または 1 回一致します。たとえば、「do(es)?」は「do」または「does」の「do」と一致します。 ? {0,1} に相当します。 {n} n は負ではない整数です。特定の回数 n 回一致します。たとえば、o{2} は「Bob」の o とは一致しませんが、「food」の両方の o には一致します。 {n,} n は負ではない整数です。少なくとも n 回一致します。たとえば、o{2,} は、「Bob」の o には一致しませんが、「foooood」のすべての o に一致します。 o{1,} は o+ と同等です。 o{0,} は o* と同等です。 {n,m} m と n は両方とも非負の整数であり、n ? 。 「」以外の一致 「 」以外の任意の 1 文字を一致させます。 任意の文字を使用するには、[. ]モード。 (パターン) パターンを一致させて、この一致を取得します。取得された一致は、VBScript の SubMatches コレクションまたは JScript の $0 ~ $9 プロパティを使用して、生成された Matches コレクションから取得できます。括弧文字と一致させるには、( または ) を使用します。 (?:パターン) パターンに一致しますが、一致結果が得られません。これは、これは非検索一致であり、後で使用するために保存されないことを意味します。これは、「または」文字 (|) を使用してパターンの一部を結合する場合に便利です。たとえば、industr(?:y|ies) は、industry|industry よりも短い式です。 (?=パターン) 前方参照。文字列一致パターンの先頭にある検索文字列と一致します。これは非フェッチ一致です。つまり、後で使用するために一致をフェッチする必要はありません。たとえば、Windows (?=95|98|NT|2000) は、「Windows 2000」の「Windows」と一致しますが、「Windows 3.1」の「Windows」とは一致しません。プリフェッチでは文字は消費されません。つまり、一致が発生した後、次の一致の検索は、プリフェッチを含む文字の後に開始されるのではなく、最後の一致の直後に開始されます。 (?!パターン) 否定検索。パターンに一致しない文字列の先頭にある検索文字列と一致します。これは非フェッチ一致です。つまり、後で使用するために一致をフェッチする必要はありません。たとえば、Windows (?!95|98|NT|2000) は、「Windows 3.1」の「Windows」と一致しますが、「Windows 2000」の「Windows」とは一致しません。プリフェッチは文字を消費しません。つまり、一致が発生した後、次の一致の検索は、プリフェッチを含む文字の後に開始されるのではなく、最後の一致の直後に開始されます

www.bkjia.comtru​​ehttp://www.bkjia.com/PHPjc/532537.html技術記事 5. すべてのシンボル解釈文字の説明は、次の文字を特殊文字、リテラル文字、後方参照、または 8 進エスケープ文字としてマークします。たとえば、n は単語と一致します...
キャラクター 説明
次の文字を特殊文字、リテラル文字、後方参照、または 8 進エスケープ文字としてマークします。たとえば、n は文字「n」と一致します。 改行文字と一致します。シーケンスは「」と一致し、「(」は「(」と一致します。
^ 入力文字列の先頭と一致します。 ^ RegExp オブジェクトの Multiline プロパティが設定されている場合にも一致します またはその後の位置。
$ 入力文字列の終了位置を一致させます。 $ は、RegExp オブジェクトの Multiline プロパティが設定されている場合にも一致します または前のポジション。
* 直前の部分式と 0 回以上一致します。たとえば、zo* は「z」と「zoo」に一致します。 * {0,} に相当します。
+ 前述の部分式と 1 回以上一致します。たとえば、zo+ は「zo」と「zoo」には一致しますが、「z」には一致しません。 + は {1,} と同等です。
文字が他の修飾子 (*、+、?、{n}、{n,}、{n,m}) の直後にある場合、一致パターンは非貪欲です。非貪欲モードは検索文字列の可能な限り少ない部分と一致しますが、デフォルトの貪欲モードは検索文字列の可能な限り多くの部分と一致します。たとえば、文字列「oooo」の場合、o+? は単一の「o」と一致しますが、o+ はすべての「o」と一致します。
x|y x または y を照合します。たとえば、z|food は「z」または「food」と一致します。 (z|f)ood は「zood」または「food」と一致します。
[xyz] キャラクターコレクション。含まれている文字のいずれかと一致します。たとえば、[abc] は「plain」の a に一致します。
[^xyz] 否定的な文字セット。含まれていない任意の文字と一致します。たとえば、[^abc] は「plain」の p に一致します。
[a-z] 文字範囲。指定された範囲内の任意の文字と一致します。たとえば、[a-z] は、a ~ z の範囲内の任意の小文字の英字と一致します。
[^a-z] 否定文字の範囲。指定された範囲内にない任意の文字と一致します。たとえば、[^a-z] は、a ~ z の範囲にない任意の文字に一致します。
単語とスペースの間の位置を指す単語の境界を照合します。たとえば、er は「never」の er に一致しますが、「動詞」の er には一致しません。
B 単語以外の境界を一致させます。 erB は「動詞」の er と一致しますが、「never」の er とは一致しません。
CX x で指定された制御文字と一致します。たとえば、cM は Control-M または復帰文字と一致します。 x の値は、A ~ Z または a ~ z のいずれかでなければなりません。それ以外の場合、c はリテラルの c 文字として扱われます。
数字と一致します。 [0-9]に相当します。
D 数字以外の文字と一致します。 [^0-9] と同等。
フォームフィードと一致します。 x0c および cL に相当します。
改行文字と一致します。 x0a および cJ に相当します。
キャリッジリターン文字と一致します。 x0d および cM に相当します。
さん スペース、タブ、フォームフィードなどを含む任意の空白文字と一致します。 [ f と同等 v]。
空白以外の文字と一致します。 [^ f と同等 v]。
タブ文字と一致します。 x09 および cI に相当します。
v 垂直タブ文字と一致します。 x0b および cK に相当します。
w アンダースコアを含む任意の単語文字と一致します。 [A-Za-z0-9_] に相当します。
W 単語以外の文字と一致します。 [^A-Za-z0-9_] と同等。
xn n と一致します。n は 16 進数のエスケープ値です。 16 進数のエスケープ値は、正確に 2 桁の長さである必要があります。たとえば、x41 は「A」と一致します。 x041 は x04 & "1" に相当します。 ASCII エンコーディングは正規表現で使用できます。 .
うーん
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。