PHP HTML 구문 분석: 제목 사이의 텍스트 추출
PHP에서는 다양한 방법을 통해 HTML 코드 구문 분석을 수행할 수 있습니다. 변수에 저장된 HTML을 처리할 때 안정성을 위해 정규식을 사용하지 않는 것이 좋습니다.
PHP DOM(문서 개체 모델) 사용
PHP DOM은 다음을 제공합니다. HTML 구문 분석에 대한 구조적 접근 방식:
$str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG'; $DOM = new DOMDocument; $DOM->loadHTML($str); $items = $DOM->getElementsByTagName('h1'); for ($i = 0; $i < $items->length; $i++) echo $items->item($i)->nodeValue . "<br/>";
이렇게 하면 출력:
T1 T2 T3
대체 접근 방식: 정규식
원하는 출력이 제목 사이의 텍스트인 경우 정규식을 활용할 수 있습니다.
$str = '<h1T1</h1>Lorem ipsum.<h1T2</h1>The quick red fox...<h1T3</h1>... jumps over the lazy brown FROG'; echo preg_replace("#<h1.*?>.*?</h1>#", "", $str);
이 표현식은 모든 HTML 태그를 제거하고 텍스트를 검색합니다.
Lorem ipsum.The quick red fox...... jumps over the lazy brown FROG
위 내용은 PHP에서 HTML 제목 사이의 텍스트를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!