>백엔드 개발 >PHP 튜토리얼 >정규 표현식 없이 PHP에서 HTML을 구문 분석하는 방법은 무엇입니까?

정규 표현식 없이 PHP에서 HTML을 구문 분석하는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-06 11:31:111002검색

How to Parse HTML in PHP without Regular Expressions?

PHP 구문 분석 HTML 코드(정규 표현식 없음)

HTML 코드가 포함된 PHP 변수가 있고, 정규식을 사용하지 않고 제목을 지정합니다.

해결책 1: PHP 문서 객체 모델 (DOM)

이 접근 방식에는 PHP DOM(문서 개체 모델)을 사용하여 HTML을 구문 분석하는 작업이 포함됩니다.

<?php
$str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG';
$DOM = new DOMDocument;
$DOM->loadHTML($str);

// Get all H1 elements
$items = $DOM->getElementsByTagName('h1');

// Display the text of each H1 element
for ($i = 0; $i < $items->length; $i++) {
    echo $items->item($i)->nodeValue . "<br/>";
}
?>

이렇게 하면 제목 내의 텍스트가 출력됩니다.

T1
T2
T3

해결책 2: 정규식 대체(다음 사이의 콘텐츠에 대해) Headings)

제목 사이의 내용을 추출하는 것이 목표라면 다음과 같이 정규식을 사용할 수 있습니다.

<?php
$str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG';
$result = preg_replace("#<h1>.*?</h1>.*?</h1>#", "", $str);

echo $result;
?>

이렇게 하면 제목 사이의 내용이 출력됩니다.

Lorem ipsum.The quick red fox...... jumps over the lazy brown FROG

위 내용은 정규 표현식 없이 PHP에서 HTML을 구문 분석하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.