JSoup 및 JavaScript 생성 콘텐츠
JSoup으로 웹페이지를 구문 분석할 때 JSoup은 HTML 구문 분석기이지 HTML 구문 분석기라는 점을 기억하는 것이 중요합니다. 브라우저 엔진. 이는 JavaScript를 실행하지 않으며 초기 페이지 로드 후 페이지에 동적으로 추가된 모든 콘텐츠가 JSoup에 표시되지 않음을 의미합니다.
예를 들어, 태그를 동적으로 추가하는 페이지를 구문 분석해야 하는 경우 JavaScript를 사용하는 div 요소에서는 JSoup이 해당 콘텐츠를 캡처할 수 없습니다. 요소 자체는 HTML 소스 코드에 존재할 수 있지만 JavaScript에서 추가한 태그는 JSoup에서 사용할 수 없습니다.
JavaScript 생성 콘텐츠 액세스
액세스하려면 JavaScript로 페이지에 추가된 콘텐츠를 보려면 브라우저 환경을 에뮬레이트할 수 있는 도구를 사용해야 합니다. 이를 수행할 수 있는 여러 Java 라이브러리가 있습니다. as:
- [Selenium](https://www.selenium.dev/)
- [HtmlUnit](https://htmlunit.sourcefor ge.io/)
- [JBrowserDriver](https://github.com/JBrowserDriver/JBrowserDriver)
이것 라이브러리를 사용하면 가상 브라우저 인스턴스를 생성하고 웹 페이지가 실제 브라우저에서 렌더링되는 것처럼 웹 페이지와 상호 작용할 수 있습니다. 이를 통해 JavaScript를 실행하고, 이벤트를 트리거하고, 동적으로 추가된 컨텐츠에 액세스할 수 있습니다.
Selenium을 사용한 예
다음은 Selenium을 사용하여 JavaScript 생성 컨텐츠를 얻는 예입니다. 참조한 페이지에서:
import org.openqa.selenium.By; import org.openqa.selenium.WebDriver; import org.openqa.selenium.WebElement; import org.openqa.selenium.chrome.ChromeDriver; public class SeleniumExample { public static void main(String[] args) { // Set up the WebDriver System.setProperty("webdriver.chrome.driver", "/path/to/chromedriver"); WebDriver driver = new ChromeDriver(); // Load the web page driver.get("http://www.bestreferat.ru/referat-32558.html"); // Wait for the div element to be filled with JavaScript WebElement tagsList = driver.findElement(By.id("tags_list")); WebDriverWait wait = new WebDriverWait(driver, 10); wait.until(ExpectedConditions.visibilityOf(tagsList)); // Get the tags from the div element List<webelement> tags = tagsList.findElements(By.tagName("a")); // Print the tags for (WebElement tag : tags) { System.out.println(tag.getText()); } // Close the WebDriver driver.close(); } }</webelement>
이 예에서는 Selenium을 사용하여 웹 페이지를 로드하고 추가할 JavaScript 생성 콘텐츠를 선택한 다음 div 요소에서 태그를 검색합니다.
위 내용은 JSoup을 사용하여 JavaScript로 생성된 콘텐츠에 어떻게 액세스할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

이 기사에서는 Java 프로젝트 관리, 구축 자동화 및 종속성 해상도에 Maven 및 Gradle을 사용하여 접근 방식과 최적화 전략을 비교합니다.

이 기사에서는 Maven 및 Gradle과 같은 도구를 사용하여 적절한 버전 및 종속성 관리로 사용자 정의 Java 라이브러리 (JAR Files)를 작성하고 사용하는 것에 대해 설명합니다.

이 기사는 카페인 및 구아바 캐시를 사용하여 자바에서 다단계 캐싱을 구현하여 응용 프로그램 성능을 향상시키는 것에 대해 설명합니다. 구성 및 퇴거 정책 관리 Best Pra와 함께 설정, 통합 및 성능 이점을 다룹니다.

이 기사는 캐싱 및 게으른 하중과 같은 고급 기능을 사용하여 객체 관계 매핑에 JPA를 사용하는 것에 대해 설명합니다. 잠재적 인 함정을 강조하면서 성능을 최적화하기위한 설정, 엔티티 매핑 및 모범 사례를 다룹니다. [159 문자]

Java의 클래스 로딩에는 부트 스트랩, 확장 및 응용 프로그램 클래스 로더가있는 계층 적 시스템을 사용하여 클래스로드, 링크 및 초기화 클래스가 포함됩니다. 학부모 위임 모델은 핵심 클래스가 먼저로드되어 사용자 정의 클래스 LOA에 영향을 미치도록합니다.


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

VSCode Windows 64비트 다운로드
Microsoft에서 출시한 강력한 무료 IDE 편집기

에디트플러스 중국어 크랙 버전
작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

SublimeText3 Linux 새 버전
SublimeText3 Linux 최신 버전

드림위버 CS6
시각적 웹 개발 도구

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는
