ホームページ  >  記事  >  バックエンド開発  >  PHP で正規表現を使用して HTML タグ間のコンテンツを抽出する方法

PHP で正規表現を使用して HTML タグ間のコンテンツを抽出する方法

Linda Hamilton
Linda Hamiltonオリジナル
2024-11-09 21:42:02942ブラウズ

How to Extract Content Between HTML Tags Using Regular Expressions in PHP?

PHP での HTML タグ間のコンテンツの抽出

PHP では、正規表現を使用して HTML 文字列から特定のコンテンツを抽出できます。これを実現するには、ターゲット タグとそのコンテンツに一致する正規表現パターンを定義する必要があります。

問題の理解

<コード> HTML 文字列からのタグ ($content として示されます)。一致した文字列を抽出、操作し、元の文字列に再挿入することが目的です。

HTML コード タグの一致

目的を達成するには、次の正規表現:

$regex = '#<\s*?code\b[^>]*>(.*?)</code\b[^>]*>#s';

パターンの分割

  • <: 先頭の < と一致します。 Character.
  • s*: 任意の数の空白文字と一致します。
  • code: リテラル文字列「code」と一致します。
  • b: タイプミスを確認します (例: < codeS>) はキャプチャされません。
  • [^>]*: 属性を含むタグのコンテンツをキャプチャします。
  • (.*?): タグ。</li> <li></codeb[^>]*>: 終了の と一致します。
  • #s: ドットオール マッチングを有効にし、改行をキャプチャできるようにします。

使用例

あなたこのパターンは次のようにコードに実装できます。

$content = "Lorem ipsum dolor sit amet, consectetur adipiscing elit. <code>Donec sed erat vel diam ultricies commodo. Nunc venenatis tellus eu quam suscipit quis fermentum dolor vehicula.</code>";
preg_match($regex, $content, $matches);

// Extract the matched code block
$matchedCode = $matches[1];

この正規表現を利用すると、 間のコンテンツを効果的に抽出できます。 HTML 文字列内のタグ。

以上がPHP で正規表現を使用して HTML タグ間のコンテンツを抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。