Web開発においてHTMLは避けては通れない部分です。ただし、場合によっては、HTML タグを含めずに HTML ソース コードからテキスト コンテンツを抽出する必要がある場合があります。ここで PHP 正規表現が登場します。
この記事では、PHP 正規表現を使用して HTML タグを削除し、HTML 文字列からプレーン テキスト コンテンツを抽出する方法を学習します。 HTML タグを削除する方法を示すために、まず HTML タグを含む文字列を定義しましょう。
$html_string = "<div><h1>Hello World</h1><p>This is <strong>PHP</strong>.</p></div>";
上記のコードは、標準の HTML タグを使用して文字列を定義します。私たちの目標は、すべての HTML マークアップを削除し、プレーン テキスト コンテンツのみを残すことです。
PHP 正規表現関数 preg_replace() は、HTML タグを削除する最も簡単な方法の 1 つです。 preg_replace() 関数を使用して、文字列からすべての HTML タグを削除しましょう。
次のコードは、preg_replace() 関数を使用して HTML タグを削除する方法を示しています。
$plain_text = preg_replace('/<[^<]+>/', '', $html_string); echo $plain_text;
上記のコードでは、正規表現パターンを使用して preg_replace() 関数を定義します。正規表現パターン `/b40ee7918ff90d0f75712682214fa6fc/
` は、「7d2aeb89f99d12416275cce32ed0df3c##」で終わるものを検索することを意味します。 #" 部分文字列を削除し、空の文字列に置き換えます。これにより、すべての HTML タグが削除されます。
$plain_text = strip_tags($html_string); echo $plain_text;上記のコードは、strip_tags() 関数を使用してすべてのタグを削除し、テキスト文字列を画面に出力します。 要約すると、PHP の正規表現は、さまざまな文字列操作の処理に使用できる非常に強力なツールです。この記事では、preg_replace() 関数とstrip_tags() 関数を使用して HTML 文字列からプレーン テキスト コンテンツを抽出する方法を学びました。正規表現を使用すると、HTML タグを簡単に削除し、プレーン テキスト コンテンツを提供できます。
以上が通常のマッチングを使用してphpでhtmlタグを削除する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。