A 요소에서 href 속성 추출
웹 페이지의 링크를 검색하려는 일반적인 접근 방식 중 하나는 정규식을 사용하는 것입니다. 그러나 href 속성이 A 태그의 첫 번째 위치에 있지 않은 경우와 같은 특정 시나리오에서는 문제가 발생할 수 있습니다.
정규 표현식 접근 방식
초기 정규 표현식은 A 태그 내 임의 위치에 있는 href 속성은 다음과 같은 경우에 어려움을 겪었습니다. "무엇?".
DOM 기반 솔루션
신뢰할 수 있는 HTML 구문 분석을 위한 regex의 한계를 고려할 때 보다 강력한 솔루션은 DOMDocument입니다. PHP의 클래스. 예는 다음과 같습니다.
$dom = new DOMDocument; $dom->loadHTML($html); foreach ($dom->getElementsByTagName('a') as $node) { echo $dom->saveHtml($node), PHP_EOL; }
이 코드는 HTML 콘텐츠를 DOMDocument 객체로 로드한 다음 getElementsByTagName 메서드를 사용하여 모든 A 요소를 검색합니다.
DOM 조작
DOM을 사용하면 A 태그에 다양한 작업을 수행할 수 있습니다. 요소:
속성에 대한 XPath 추출:
XPath는 속성 추출을 위한 또 다른 옵션을 제공합니다. 예는 다음과 같습니다.
$xpath = new DOMXPath($dom); $nodes = $xpath->query('//a/@href'); foreach($nodes as $href) { echo $href->nodeValue; }
추가 리소스:
참고할 만한 점 https://www.php.cn/link/274da997412973c08cf7e78724153f55 귀하의 질문이 중복될 수 있으며 답변은 기존 토론에서 찾을 수 있습니다.
위 내용은 HTML의 A 요소에서 href 속성을 어떻게 안정적으로 추출할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!