Maison >Java >javaDidacticiel >Comment extraire des données de sites Web à l'aide de Java et Jsoup ?
Extraction des données d'un site Web avec Java
Pour récupérer des informations d'un site Web dans votre programme Java, utilisez un analyseur HTML tel que Jsoup. Les sélecteurs CSS de type jQuery de Jsoup et la classe itérable représentant une liste de nœuds (Elements) en font un choix privilégié.
Processus :
Exemple (récupération de questions et de réponses de Stack Overflow) :
<code class="java">import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class WebsiteDataRetrieval { public static void main(String[] args) throws Exception { String url = "https://stackoverflow.com/questions/2835505"; Document document = Jsoup.connect(url).get(); // Extract the question String question = document.select("#question .post-text").text(); System.out.println("Question: " + question); // Extract the answerers Elements answerers = document.select("#answers .user-details a"); for (Element answerer : answerers) { System.out.println("Answerer: " + answerer.text()); } } }</code>
Cet exemple affiche la question et la liste des répondeurs pour la question Stack Overflow spécifiée.
Dépannage the NoSuchMethodError :
L'erreur que vous rencontrez avec Jsoup est liée à un problème dans la version que vous utilisez. Assurez-vous que vous travaillez avec une version récente de Jsoup, car elle a résolu ce problème. De plus, assurez-vous d'avoir les bibliothèques Apache Commons dans votre chemin de classe.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!