Maison  >  Article  >  Java  >  Comment extraire des données de sites Web à l’aide de Java et Jsoup ?

Comment extraire des données de sites Web à l’aide de Java et Jsoup ?

Linda Hamilton
Linda Hamiltonoriginal
2024-10-30 17:30:25171parcourir

How to Extract Data from Websites Using Java and Jsoup?

Extraction des données d'un site Web avec Java

Pour récupérer des informations d'un site Web dans votre programme Java, utilisez un analyseur HTML tel que Jsoup. Les sélecteurs CSS de type jQuery de Jsoup et la classe itérable représentant une liste de nœuds (Elements) en font un choix privilégié.

Processus :

  1. Établir un Connexion : Utilisez la méthode Jsoup.connect(url) pour établir une connexion à la page Web souhaitée.
  2. Récupérez la page : Exécutez la méthode get() sur la connexion pour obtenir le document HTML de la page.
  3. Analyser le document : Utilisez la méthode select() de Jsoup avec les sélecteurs CSS appropriés pour extraire les données dont vous avez besoin.

Exemple (récupération de questions et de réponses de Stack Overflow) :

<code class="java">import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class WebsiteDataRetrieval {

    public static void main(String[] args) throws Exception {
        String url = "https://stackoverflow.com/questions/2835505";
        Document document = Jsoup.connect(url).get();

        // Extract the question
        String question = document.select("#question .post-text").text();
        System.out.println("Question: " + question);

        // Extract the answerers
        Elements answerers = document.select("#answers .user-details a");
        for (Element answerer : answerers) {
            System.out.println("Answerer: " + answerer.text());
        }
    }
}</code>

Cet exemple affiche la question et la liste des répondeurs pour la question Stack Overflow spécifiée.

Dépannage the NoSuchMethodError :

L'erreur que vous rencontrez avec Jsoup est liée à un problème dans la version que vous utilisez. Assurez-vous que vous travaillez avec une version récente de Jsoup, car elle a résolu ce problème. De plus, assurez-vous d'avoir les bibliothèques Apache Commons dans votre chemin de classe.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn