Heim >Java >javaLernprogramm >Wie extrahiere ich Daten von Websites mit Java und Jsoup?
Website-Daten mit Java extrahieren
Um Informationen von einer Website in Ihr Java-Programm abzurufen, verwenden Sie einen HTML-Parser wie Jsoup. Die jQuery-ähnlichen CSS-Selektoren und die iterierbare Klasse von Jsoup, die eine Knotenliste (Elemente) darstellen, machen es zu einer bevorzugten Wahl.
Prozess:
Beispiel (Abrufen von Fragen und Antworten aus Stack Overflow):
<code class="java">import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class WebsiteDataRetrieval { public static void main(String[] args) throws Exception { String url = "https://stackoverflow.com/questions/2835505"; Document document = Jsoup.connect(url).get(); // Extract the question String question = document.select("#question .post-text").text(); System.out.println("Question: " + question); // Extract the answerers Elements answerers = document.select("#answers .user-details a"); for (Element answerer : answerers) { System.out.println("Answerer: " + answerer.text()); } } }</code>
Dieses Beispiel gibt die Frage und die Liste der Antworten für die angegebene Stack Overflow-Frage aus.
Fehlerbehebung der NoSuchMethodError:
Der Fehler, der bei Jsoup auftritt, bezieht sich auf ein Problem in der von Ihnen verwendeten Version. Stellen Sie sicher, dass Sie mit einer aktuellen Version von Jsoup arbeiten, da dieses Problem dadurch behoben wurde. Stellen Sie außerdem sicher, dass sich in Ihrem Klassenpfad die Apache Commons-Bibliotheken befinden.
Das obige ist der detaillierte Inhalt vonWie extrahiere ich Daten von Websites mit Java und Jsoup?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!