>  기사  >  Java  >  Java 및 Jsoup를 사용하여 웹사이트에서 데이터를 추출하는 방법은 무엇입니까?

Java 및 Jsoup를 사용하여 웹사이트에서 데이터를 추출하는 방법은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-10-30 17:30:25232검색

How to Extract Data from Websites Using Java and Jsoup?

Java로 웹사이트 데이터 추출

웹사이트에서 Java 프로그램으로 정보를 검색하려면 Jsoup와 같은 HTML 파서를 사용하세요. Jsoup의 jQuery와 유사한 CSS 선택기와 노드 목록(요소)을 나타내는 반복 가능한 클래스는 Jsoup을 선호하는 선택으로 만듭니다.

프로세스:

  1. 연결: Jsoup.connect(url) 메소드를 사용하여 원하는 웹페이지에 대한 연결을 설정합니다.
  2. 페이지 검색: 연결에서 get() 메소드를 실행하여 웹페이지를 가져옵니다. 페이지의 HTML 문서.
  3. 문서 구문 분석: 적절한 CSS 선택기와 함께 Jsoup의 select() 메소드를 활용하여 필요한 데이터를 추출합니다.

예(스택 오버플로에서 질문 및 답변 검색):

<code class="java">import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class WebsiteDataRetrieval {

    public static void main(String[] args) throws Exception {
        String url = "https://stackoverflow.com/questions/2835505";
        Document document = Jsoup.connect(url).get();

        // Extract the question
        String question = document.select("#question .post-text").text();
        System.out.println("Question: " + question);

        // Extract the answerers
        Elements answerers = document.select("#answers .user-details a");
        for (Element answerer : answerers) {
            System.out.println("Answerer: " + answerer.text());
        }
    }
}</code>

이 예는 지정된 스택 오버플로 질문에 대한 질문과 답변자 목록을 출력합니다.

문제 해결 NoSuchMethodError:

Jsoup에서 발생한 오류는 사용 중인 버전의 문제와 관련이 있습니다. 이 문제가 해결되었으므로 최신 버전의 Jsoup를 사용하여 작업하고 있는지 확인하세요. 또한 클래스 경로에 Apache Commons 라이브러리가 있는지 확인하세요.

위 내용은 Java 및 Jsoup를 사용하여 웹사이트에서 데이터를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.