ホームページ >ウェブフロントエンド >htmlチュートリアル >【Jsoup学習エチケット】要素から属性、テキスト、HTML_html/css_WEB-ITnoseを抽出する

【Jsoup学習エチケット】要素から属性、テキスト、HTML_html/css_WEB-ITnoseを抽出する

WBOY
WBOYオリジナル
2016-06-24 11:48:25852ブラウズ

問題

Document インスタンス オブジェクトを取得するために解析し、いくつかの要素を見つけた後、これらの要素内のデータを取得したいとします。

メソッド

  • 属性の値を取得するには、Node.attr(String key) メソッドを使用できます
  • 要素内のテキストの場合は、Element.text() メソッドを使用できます
  • HTML の取得には、要素または属性内 コンテンツの場合は、Element.html() または Node.outerHtml() メソッドを使用できます
  • 例:

    String html = "<p>An <a href='http://example.com/'><b>example</b></a> link.</p>";Document doc = Jsoup.parse(html);//解析HTML字符串返回一个Document实现Element link = doc.select("a").first();//查找第一个a元素String text = doc.body().text(); // "An example link"//取得字符串中的文本String linkHref = link.attr("href"); // "http://example.com/"//取得链接地址String linkText = link.text(); // "example""//取得链接地址中的文本String linkOuterH = link.outerHtml();     // "<a href="http://example.com"><b>example</b></a>"String linkInnerH = link.html(); // "<b>example</b>"//取得链接内的html内容

    説明

    上記のメソッドは、要素データ アクセスの中核となるメソッドです。さらに、使用できる他のメソッドもあります:

  • Element.id()
  • Element.tagName()
  • Element.className() および Element.hasClass(String className)
  • これらのアクセサー メソッドには、対応するセッター メソッドがあります。データを変更します。

    声明:
    この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。