ホームページ >バックエンド開発 >PHPチュートリアル >PHP 文字列から HTML タグと PHP タグを削除する方法

PHP 文字列から HTML タグと PHP タグを削除する方法

王林
王林転載
2024-03-19 14:07:11464ブラウズ

php エディタ Xiaoxin は、PHP を使用して文字列から HTML タグと PHP タグを削除する方法を紹介します。 Web 開発では、タグを含むテキストを処理する必要がよくあります。プレーン テキスト コンテンツを取得するには、PHP のstrip_tags() 関数を使用して HTML タグを削除し、preg_replace() 関数を使用して PHP タグを削除します。これら 2 つの関数を一緒に使用すると、文字列からマーカーを簡単に削除でき、テキスト コンテンツをより便利に処理できるようになります。次は操作方法を詳しく見ていきましょう!

文字列から HTML タグと PHP タグを削除する

######導入:### データ処理では、プレーン テキスト コンテンツを取得したり、不要なコードの実行を防止したりするために、文字列から HTML タグや PHP タグを削除することが必要になることがよくあります。 PHP は、この目標を達成するために、さまざまな関数と

正規表現を提供します。 方法 1:strip_tags() 関数

strip_tags() 関数は、コメントやスクリプトを含むすべての HTML タグと PHP タグを文字列から削除します。その構文は次のとおりです:

string ストリップタグ(文字列 $str, 文字列 $allow_tags = null)

このうち、$str は処理対象の文字列、$allow_tags は保持する HTML タグのリストを指定するオプションのパラメータです。例えば:###
$str = "<h1>Hello,world!</h1><p>これは段落です。</p>";
$result =strip_tags($str); // 出力: 「こんにちは、世界!これは段落です。」

方法 2: 正規表現

正規表現を使用すると、HTML タグと PHP タグをより柔軟に削除できます。次の正規表現を使用できます: /17176c7692d2e74a02791bff7a1db971|47132abfaba654bff1541abc6dd4cc3b|(?46f3ebdac34cb3a5c483115fc3074f5e])>549a3fd9a3c62568d8b32cd8627105c3] )> ;/s

この正規表現は、コメント、スクリプト、自己終了タグを含む、すべての HTML タグと PHP タグに一致します。 preg_replace() 関数を使用して削除できます:

$str = "<h1>Hello,world!</h1><p>これは段落です。</p>";
$result = preg_replace("/<(!--.*?-->|<?.*??>|(?<=[^>])><[^> ] )>/s", "", $str);

方法 3: DOMDocument クラス

DOMDocument クラスは、XML ドキュメントおよび HTML ドキュメントへの低レベルのアクセスを提供します。このクラスを使用すると、次の方法で文字列から HTML タグを削除できます。 DOMDocument オブジェクトを作成し、文字列を読み込みます。

loadHTML() メソッドを使用して文字列をロードします。

    saveHTML() メソッドを呼び出して、マークアップが削除されたプレーン テキストを含む文字列としてドキュメントを保存します。
  1. $str = "4a249f0d628e2318394fd9b75b4636b1Hello,world!473f0a7621bec819994bb5020d29372ae388a4556c0f65e1904146cc1a846beeこれは段落です。94b3e26ee717c64999d7867364b1b4a3"; $dom = 新しい DOMDocument(); $dom->loadHTML($str); $result = $dom->saveHTML();
  2. パフォーマンスの比較:
これら 3 つの方法の間には、パフォーマンスに微妙な違いがあります。文字列が小さい場合は、通常、strip_tags() 関数が最も高速です。文字列が大きい場合は、正規表現の方が若干高速になる可能性があります。 DOMDocument クラスは、複雑な HTML ドキュメントを処理する場合に遅くなります。 

選択方法:

どの方法を選択するかは、特定のニーズと処理される文字列の種類によって異なります。単純なテキスト処理の場合は、通常、strip_tags() 関数で十分です。より複雑なニーズの場合は、正規表現または DOMDocument クラスにより、より多くの制御オプションが提供されます。

以上がPHP 文字列から HTML タグと PHP タグを削除する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はlsjlt.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。