웹 개발에 있어서 HTML은 빼놓을 수 없는 부분입니다. 그러나 어떤 경우에는 HTML 태그를 포함하지 않고 HTML 소스 코드에서 텍스트 콘텐츠를 추출해야 할 수도 있습니다. 이것이 PHP 정규 표현식이 들어오는 곳입니다.
이 기사에서는 PHP 정규 표현식을 사용하여 HTML 태그를 제거하고 HTML 문자열에서 일반 텍스트 콘텐츠를 추출하는 방법을 알아봅니다. HTML 태그를 제거하는 방법을 보여주기 위해 먼저 HTML 태그가 포함된 문자열을 정의해 보겠습니다.
$html_string = "<div><h1>Hello World</h1><p>This is <strong>PHP</strong>.</p></div>";
위 코드는 표준 HTML 마크업으로 문자열을 정의합니다. 우리의 목표는 모든 HTML 마크업을 제거하고 일반 텍스트 콘텐츠만 남기는 것입니다.
PHP 정규 표현식 함수 preg_replace()는 HTML 태그를 제거하는 가장 쉬운 방법 중 하나입니다. preg_replace() 함수를 사용하여 문자열에서 모든 HTML 태그를 제거해 보겠습니다.
다음 코드는 preg_replace() 함수를 사용하여 HTML 태그를 제거하는 방법을 보여줍니다.
$plain_text = preg_replace('/<[^<]+>/', '', $html_string); echo $plain_text;
위 코드에서는 정규식 패턴으로 preg_replace() 함수를 정의합니다. 정규식 패턴 `/1dad84ea0069e7538b7dfc1ec7547c1e/
`表示查找任何以"2ff389bab4b65411d70c7e1e841e324a
"은 하위 문자열로 끝나고 이를 빈 문자열로 바꿉니다. 이렇게 하면 모든 HTML 태그가 제거됩니다.
마지막으로 HTML 태그를 포함하지 않는 문자열을 화면에 출력합니다.
preg_replace( ) 함수에는 HTML 태그를 제거하는 데 사용할 수 있는 다른 함수가 많이 있습니다. 예를 들어,
strip_tags() 함수의 구문은 다음과 같습니다.
위 코드 모든 태그를 제거하고 텍스트 문자열을 화면에 출력하려면 Strip_tags() 함수를 사용하세요. 요약하자면, PHP의 정규식은 매우 강력한 도구이며 이 기사에서 다양한 문자열 작업을 처리하는 데 사용할 수 있습니다. preg_replace() 함수와 Strip_tags() 함수를 사용하여 HTML 문자열에서 일반 텍스트 콘텐츠를 추출하는 방법을 배웠습니다. 정규식을 사용하면 HTML 태그를 쉽게 제거하고 일반 텍스트 콘텐츠를 제공할 수 있습니다.위 내용은 일반 매칭을 사용하여 PHP에서 HTML 태그를 제거하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!