Heim  >  Artikel  >  Java  >  Wie extrahiere ich Daten von Websites mit Java und Jsoup?

Wie extrahiere ich Daten von Websites mit Java und Jsoup?

Linda Hamilton
Linda HamiltonOriginal
2024-10-30 17:30:25171Durchsuche

How to Extract Data from Websites Using Java and Jsoup?

Website-Daten mit Java extrahieren

Um Informationen von einer Website in Ihr Java-Programm abzurufen, verwenden Sie einen HTML-Parser wie Jsoup. Die jQuery-ähnlichen CSS-Selektoren und die iterierbare Klasse von Jsoup, die eine Knotenliste (Elemente) darstellen, machen es zu einer bevorzugten Wahl.

Prozess:

  1. Erstellen Sie a Verbindung: Verwenden Sie die Methode Jsoup.connect(url), um eine Verbindung zur gewünschten Webseite herzustellen.
  2. Seite abrufen: Führen Sie die Methode get() auf der abzurufenden Verbindung aus Das HTML-Dokument der Seite.
  3. Parsen Sie das Dokument: Verwenden Sie die Methode select() von Jsoup mit geeigneten CSS-Selektoren, um die benötigten Daten zu extrahieren.

Beispiel (Abrufen von Fragen und Antworten aus Stack Overflow):

<code class="java">import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class WebsiteDataRetrieval {

    public static void main(String[] args) throws Exception {
        String url = "https://stackoverflow.com/questions/2835505";
        Document document = Jsoup.connect(url).get();

        // Extract the question
        String question = document.select("#question .post-text").text();
        System.out.println("Question: " + question);

        // Extract the answerers
        Elements answerers = document.select("#answers .user-details a");
        for (Element answerer : answerers) {
            System.out.println("Answerer: " + answerer.text());
        }
    }
}</code>

Dieses Beispiel gibt die Frage und die Liste der Antworten für die angegebene Stack Overflow-Frage aus.

Fehlerbehebung der NoSuchMethodError:

Der Fehler, der bei Jsoup auftritt, bezieht sich auf ein Problem in der von Ihnen verwendeten Version. Stellen Sie sicher, dass Sie mit einer aktuellen Version von Jsoup arbeiten, da dieses Problem dadurch behoben wurde. Stellen Sie außerdem sicher, dass sich in Ihrem Klassenpfad die Apache Commons-Bibliotheken befinden.

Das obige ist der detaillierte Inhalt vonWie extrahiere ich Daten von Websites mit Java und Jsoup?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn