ホームページ >バックエンド開発 >PHPの問題 >通常のマッチングを使用してphpでhtmlタグを削除する方法

通常のマッチングを使用してphpでhtmlタグを削除する方法

PHPz
PHPzオリジナル
2023-03-21 17:17:361690ブラウズ

Web開発においてHTMLは避けては通れない部分です。ただし、場合によっては、HTML タグを含めずに HTML ソース コードからテキスト コンテンツを抽出する必要がある場合があります。ここで PHP 正規表現が登場します。

この記事では、PHP 正規表現を使用して HTML タグを削除し、HTML 文字列からプレーン テキスト コンテンツを抽出する方法を学習します。 HTML タグを削除する方法を示すために、まず HTML タグを含む文字列を定義しましょう。

$html_string = "<div><h1>Hello World</h1><p>This is <strong>PHP</strong>.</p></div>";

上記のコードは、標準の HTML タグを使用して文字列を定義します。私たちの目標は、すべての HTML マークアップを削除し、プレーン テキスト コンテンツのみを残すことです。

PHP 正規表現関数 preg_replace() は、HTML タグを削除する最も簡単な方法の 1 つです。 preg_replace() 関数を使用して、文字列からすべての HTML タグを削除しましょう。

次のコードは、preg_replace() 関数を使用して HTML タグを削除する方法を示しています。

$plain_text = preg_replace(&#39;/<[^<]+>/&#39;, &#39;&#39;, $html_string);
echo $plain_text;

上記のコードでは、正規表現パターンを使用して preg_replace() 関数を定義します。正規表現パターン `/b40ee7918ff90d0f75712682214fa6fc/` は、「7d2aeb89f99d12416275cce32ed0df3c##」で終わるものを検索することを意味します。 #" 部分文字列を削除し、空の文字列に置き換えます。これにより、すべての HTML タグが削除されます。

最後に、HTMLタグを含まない文字列を画面に出力します。

preg_replace() 関数に加えて、HTML タグを削除するために使用できる関数が他にもたくさんあります。たとえば、strip_tags() 関数を使用して HTML タグを削除することもできます。

strip_tags() 関数の構文は次のとおりです。

$plain_text = strip_tags($html_string);
echo $plain_text;

上記のコードは、strip_tags() 関数を使用してすべてのタグを削除し、テキスト文字列を画面に出力します。

要約すると、PHP の正規表現は、さまざまな文字列操作の処理に使用できる非常に強力なツールです。この記事では、preg_replace() 関数とstrip_tags() 関数を使用して HTML 文字列からプレーン テキスト コンテンツを抽出する方法を学びました。正規表現を使用すると、HTML タグを簡単に削除し、プレーン テキスト コンテンツを提供できます。

以上が通常のマッチングを使用してphpでhtmlタグを削除する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。