>  기사  >  백엔드 개발  >  Strip_tags 이외의 HTML 특수 문자 코드를 효과적으로 제거하는 방법은 무엇입니까?

Strip_tags 이외의 HTML 특수 문자 코드를 효과적으로 제거하는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-10-18 20:52:02979검색

How to Effectively Remove HTML Special Character Codes Beyond strip_tags?

효과적인 HTML 특수 문자 제거: Strip_tags 이상 확장

strip_tags는 HTML 태그를 효과적으로 제거하지만 HTML 특수 문자 코드가 남을 수 있습니다. ' '와 같은 코드 및 '©'는 RSS 피드 파일 콘텐츠를 방해할 수 있습니다.

이 문제를 해결하려면 다음 기능 중 하나를 활용하는 것이 좋습니다.

  1. html_entity_decode: 디코드 이러한 코드를 해당 문자로 변환합니다.
  2. preg_replace: 정규식을 사용하여 다음 패턴을 사용하여 코드를 제거합니다.
$Content = preg_replace("/&#?[a-z0-9\s]*;/i","",$Content); 

이 패턴은 일치하고 제거합니다. 세미콜론이 포함된 모든 문자 코드.

세련된 접근 방식

의도하지 않은 대체 가능성을 제한하려면 Jacco가 제안한 대로 정규식을 조정하세요.

$Content = preg_replace("/&#?[a-z0-9\s]{2,8};/i","",$Content); 

이 개정된 패턴은 실수로 완전한 문장이 수정되는 것을 방지하기 위해 2~8자 길이의 코드만 일치하고 제거합니다.

위 내용은 Strip_tags 이외의 HTML 특수 문자 코드를 효과적으로 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.