ホームページ > 記事 > ウェブフロントエンド > 【Jsoup学習エチケット】HTMLの解析 string_html/css_WEB-ITnose
ユーザー入力、ファイル、または Web サイトからの HTML 文字列。場合によっては、それを解析してその内容を取得するか、形式が完全であるかどうかを確認するか、変更する必要があります。何をするか? jsonu を使用すると、これらの問題を簡単に解決できます
静的な Jsoup.parse(String html) メソッドまたは Jsoup.parse(String html, String BaseUri) サンプル コードを使用します:
String html = "<html><head><title>First parse</title></head>" + "<body><p>Parsed HTML into a doc.</p></body></html>";Document doc = Jsoup.parse(html);
parse(String html, String BaseUri) ) このメソッドは、入力 HTML を解析して新しいドキュメント (Document) を作成できます。baseUri パラメーターは、相対 URL を絶対 URL に変換し、ドキュメントを取得する Web サイトを指定するために使用されます。このメソッドが適用できない場合は、上記の例のように、parse(String html) メソッドを使用して HTML 文字列に解析できます。 .
解析された文字列が空の文字列でない限り、(少なくとも) head 要素と body 要素を含む適切に構造化されたドキュメントが返されます。
Document を取得したら、Document の適切なメソッド、またはその親クラスである Element および Node のメソッドを使用して、関連するデータを取得できます。