ホームページ  >  記事  >  バックエンド開発  >  ストリップタグ以外の HTML 特殊文字コードを効果的に削除するにはどうすればよいですか?

ストリップタグ以外の HTML 特殊文字コードを効果的に削除するにはどうすればよいですか?

Patricia Arquette
Patricia Arquetteオリジナル
2024-10-18 20:52:02979ブラウズ

How to Effectively Remove HTML Special Character Codes Beyond strip_tags?

効果的な HTML 特殊文字の削除:strip_tags を超えた拡張

strip_tags は HTML タグを効果的に削除しますが、HTML 特殊文字コードが残る可能性があります。 「 」などのコード

この問題に対処するには、次の関数のいずれかの利用を検討してください:

  1. html_entity_decode: デコードこれらのコードを対応する文字に変換します。
  2. preg_replace: 正規表現を使用して、次のパターンを使用してコードを削除します:
$Content = preg_replace("/&#?[a-z0-9\s]*;/i","",$Content); 

このパターンは一致して削除されます。セミコロンを含む任意の文字コード。

洗練されたアプローチ

意図しない置換の可能性を制限するには、Jacco が提案したように正規表現を調整します。

$Content = preg_replace("/&#?[a-z0-9\s]{2,8};/i","",$Content); 

この改訂されたパターンは、完全な文を誤って変更することを避けるために、長さ 2 ~ 8 文字のコードのみを照合して削除します。

以上がストリップタグ以外の HTML 特殊文字コードを効果的に削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。