ホームページ  >  記事  >  ウェブフロントエンド  >  【Jsoup学習エチケット】HTMLの解析 string_html/css_WEB-ITnose

【Jsoup学習エチケット】HTMLの解析 string_html/css_WEB-ITnose

WBOY
WBOYオリジナル
2016-06-24 11:48:271202ブラウズ

問題があります

ユーザー入力、ファイル、または Web サイトからの HTML 文字列。場合によっては、それを解析してその内容を取得するか、形式が完全であるかどうかを確認するか、変更する必要があります。何をするか? jsonu を使用すると、これらの問題を簡単に解決できます

解決策

静的な Jsoup.parse(String html) メソッドまたは Jsoup.parse(String html, String BaseUri) サンプル コードを使用します:

String html = "<html><head><title>First parse</title></head>"  + "<body><p>Parsed HTML into a doc.</p></body></html>";Document doc = Jsoup.parse(html);

説明

parse(String html, String BaseUri) ) このメソッドは、入力 HTML を解析して新しいドキュメント (Document) を作成できます。baseUri パラメーターは、相対 URL を絶対 URL に変換し、ドキュメントを取得する Web サイトを指定するために使用されます。このメソッドが適用できない場合は、上記の例のように、parse(String html) メソッドを使用して HTML 文字列に解析できます。 .

解析された文字列が空の文字列でない限り、(少なくとも) head 要素と body 要素を含む適切に構造化されたドキュメントが返されます。

Document を取得したら、Document の適切なメソッド、またはその親クラスである Element および Node のメソッドを使用して、関連するデータを取得できます。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。