PHP에서 HTML/XML을 구문 분석하고 처리하는 방법 네이티브 XML 확장 DOM : XML 조작 및 쿼리를 허용하는 강력한 DOM API 문서. XMLReader: 문서의 개별 노드에 대한 액세스를 제공하는 XML 풀 파서. XML 파서: SAX 스타일 XML 푸시 파서 XML의 이벤트 중심 처리를 허용합니다. elements. SimpleXML: 속성 선택기와 배열 반복기를 사용하여 XML을 객체로 변환하여 XML 구문 분석을 단순화합니다. 타사 라이브러리(LibXML) 기반) FluentDom: DOM 조작을 위한 jQuery와 유사한 유창한 인터페이스. HtmlPageDom: 다음을 위한 메소드로 DOMCrawler를 확장합니다. HTML 조작 document. phpQuery: jQuery 스타일 CSS 선택기 기반 DOM API. Laminas-Dom: DOM 문서 쿼리를 위한 통합 인터페이스를 제공합니다. XPath와 CSS를 사용하여 selectors. fDOMDocument: 편의를 위해 예외 및 사용자 정의 메서드를 사용하여 표준 DOM을 확장합니다. Sabre/XML: XMLReader 및 XMLWriter 클래스를 래핑하고 확장합니다. 대상을 위해 mapping. FluidXML: XPath 및 Fluent 프로그래밍 패턴으로 XML을 조작하기 위한 Fluent API. 타사 (비-LibXML 기반) PHP Simple HTML DOM Parser: 유효하지 않은 HTML을 지원하지만 성능이 낮습니다. PHP Html 파서: CSS 선택기를 지원하는 간단한 HTML 파서이지만 느립니다. HTML 5 HTML5DOMDocument: 버그를 수정하고 HTML5용 DOMDocument 라이브러리에 기능을 추가합니다. HTML5: 표준을 준수하는 HTML5 파서 및 작성기는 전적으로 PHP로 작성되었습니다. 정규 표현식(최소 권장) 취약하고 HTML 파싱에 적합하지 않음 구문론적 도서 PHP를 사용한 웹스크래핑을 위한 PHP 설계자 가이드