PHP의 DOMDocument로 HTML 구문 분석
PHP의 DOMDocument를 사용하여 HTML에서 특정 텍스트 요소를 추출하려면 XPath 쿼리를 활용하는 것이 단독으로 의존하는 것보다 더 효과적일 수 있습니다. DOMDocument::getElementsByTagName에 있습니다. XPath 쿼리를 사용하면 문서 구조 내의 특정 기준에 따라 정확한 선택이 가능합니다.
중첩 DIV에서 텍스트 캡처
제공된 예제 HTML에는 중첩된
대상 텍스트를 캡처하기 위해 XPath 쿼리를 사용할 수 있습니다.
<code class="php">$xpath->query('//div[@class="main"]/div[@class="text"]');</code>
이 쿼리는 모든
노드 값 반복 및 추출
실제 텍스트 콘텐츠에 액세스하려면 일치하는 각 요소를 반복하고 해당 nodeValue를 사용할 수 있습니다. 액세스된 속성:
<code class="php">foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }</code>
trim() 함수는 추출된 텍스트에서 선행 또는 후행 공백을 제거하는 데 사용됩니다.
실행 출력
코드를 실행하면 다음이 출력됩니다:
string 'Capture this text 1' (length=19) string 'Capture this text 2' (length=19)
위 내용은 PHP의 DOMDocument 및 XPath를 사용하여 HTML에서 특정 텍스트를 어떻게 추출합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!