HTML タグは最近の Web サイトでよく使用されており、これらのタグにはタイトルや段落などのさまざまな要素が含まれています。 PHP 開発者であれば、後で使用するために HTML ファイルからすべての見出しと段落タグを抽出する必要が生じたことがあるかもしれません。ここで正規表現が役に立ちます。この記事では、PHP 正規表現を使用して HTML のすべての見出しと段落を照合する方法を説明します。 まず、HTML のタイトルと段落のタグが何であるかを知る必要があります。 HTML タグにはさまざまなタイトル要素と段落要素が含まれており、最も一般的なものは、タイトルを表すために使用される h1、h2、h3 およびその他のタグであり、段落を表すために使用されるのは p タグです。この記事では、これらの最も一般的に使用されるタグのみに焦点を当てます。 次に、PHP 正規表現を使用して HTML のタイトル タグと段落タグを照合する方法を見てみましょう。以下のコードは、HTML ファイルを読み取り、正規表現を使用してファイル内のすべての見出しと段落を照合する単純な PHP スクリプトを示しています。 ]*>(.*?)>/si'; preg_match_all($pattern, $html, $matches); // 显示所匹配的结果 print_r($matches[0]); ?>このコード スニペットの正規表現/c538d01664a560d8949071f677d4adee]*>(.*?)0468589710c60a96e6cf456cf4fedd26/si 次のことができます: e0ad6a532cfbaedae221dc377a1c5335 メタキャラクターは、HTML タグの先頭と末尾を一致させるために使用されます。 hd|p は、すべての見出し (h1、h2、h3 など) と段落 (p) タグに一致することを意味します。 [^>]* は、> を除くタグ内のすべての文字に一致します。> はタグの開始点であるためです。 . 開始位置の区切り文字。 (.*?) タグの途中にあるテキストを一致させるには、非貪欲一致を使用します。 0468589710c60a96e6cf456cf4fedd26 は、開始タグに対応する終了タグを一致させることを意味します。 は、以前に指定したタグ (つまり、hd|p) と一致することを意味します。 この正規表現では、2 つのパターン修飾子 s と i を使用します。このうち、s は、. メタキャラクターが改行を含むすべての文字と一致するように、「ドット マッチング モード」をオンにするために使用されます。また、i は、タグ名の大文字と小文字が一致結果に影響しないように、「大文字と小文字を区別しないモード」をオンにするために使用されます。 スクリプトの実行が終了すると、一致するすべての見出しと段落タグが出力されます。結果は次のようになります。 Array ( [0] => PHP 正则表达式 [1] => 现代网站中常常会用到 HTML 标记,这些标记包含了各种元素,例如标题和段落等等。 [2] => 标题2 [3] => 段落2 [4] => 标题3 [5] => 段落3 ) この結果では、PHP 正規表現が HTML 内のすべての見出しタグと段落タグに正常に一致したことがわかります。この正規表現には、HTML 内のリンク、画像、表の照合など、他のアプリケーション シナリオもあります。この記事が、HTML 内の要素を照合するための PHP 正規表現の使用についての理解を深めるのに役立つことを願っています。