搜尋
首頁Javajava教程Jsoup的簡易使用範例

Jsoup的簡易使用範例

May 28, 2017 am 11:29 AM
jsoup

 

 

#測試用網頁


nbsp;html><!-- http://jwc.yangtzeu.edu.cn/ -->
    <meta>
    <title>长江大学</title>
    <link>
    <link>
    <link>
    <script></script>
    <script></script>
    <script></script>

    <p>

        <!-- 顶部图片p -->
        </p><p></p>

        <!-- 顶部菜单p -->
        <p>

            </p><p>

                </p><p><a>首页</a></p>
                <p><a>机构设置</a></p>
                <p><a>规章制度</a></p>
                <p><a>教学建设</a></p>
                <p><a>教务管理</a></p>
                <p><a>考务管理</a></p>
                <p><a>实践创新</a></p>
                <p><a>质量评估</a></p>
                <p><a>学务管理</a></p>
                <p><a>服务指南</a></p>
                <p><a>下载中心</a></p>

            

        
        <p></p>

        <!-- 顶部时间p -->
        <p></p>
        <p></p>

        <!-- 中间的tablep -->
        <p>

            <!-- 左侧table-cell -->
            </p><p>

                </p><p></p>
                <p></p>

                <h2>高教信息<a>+MORE</a>
</h2>
                
                

                

友情链接

                

                         

                         

                

教务通知本周事务

                
                        
  • 关于组织2017年(第十二届)长江大学大学生化学实验2017-03-30
  •                     
  • 关于核查文科相关学院2013级毕业班学生成绩的通知2017-03-30
  •                     
  • 关于组织申报第二批校级双语教学示范课程的通知2017-03-30
  •                     
  • 查看更多...
  •                 
                
                        
  • 2016~2017学年第二学期6~7月份主要教学工作安排2017-03-30
  •                     
  • 2016~2017学年第二学期5月份主要教学工作安排2017-03-30
  •                     
  • 2016~2017学年第二学期4月份主要教学工作安排2017-03-30
  •                     
  • 2016~2017学年第二学期3月份主要教学工作安排2017-03-30
  •                     
  • 查看更多...
  •                 
                

教务通知本周事务

                                      

            

                 

                 

        

              

    <script> setup(); switchTab(elementById("notice")); addEventss(); </script>

 

Java程式碼


#
import java.io.File;import java.util.ArrayList;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;public class App {    public static void main(String args[]) {        try {

            File input = new File("/Users/YouXianMing/Documents/Project/HTML Project/yangtze/yangtze.html");
            Document doc = Jsoup.parse(input, "UTF-8", "http://yangtze.com/");            // 根据元素id获取元素            {
                Element content = doc.getElementById("content");
                System.out.println(content);
            }            // 根据CSS的class名获取元素数组            {
                ArrayList<element> list = doc.getElementsByClass("space");                for (Element element : list) {
                    System.out.println(element + "\n");
                }
            }            // 根据标签获取元素数组            {
                ArrayList<element> list = doc.getElementsByTag("p");                for (Element element : list) {
                    System.out.println(element + "\n");
                }
            }            // 根据元素中含有的属性值获取元素数组            {
                ArrayList<element> list = doc.getElementsByAttribute("href");                for (Element element : list) {
                    System.out.println(element + "\n");
                }
            }            // 根据元素中含有的属性值获取元素数组            {
                Element content = doc.getElementById("header-menu-table");                // 元素的父元素                System.out.println(content.parent());                // 元素的所有子元素                System.out.println(content.children());                // 与该元素平级的第一个兄弟元素
                System.out.println(content.child(0).firstElementSibling());                // 与该元素平级的最后一个兄弟元素
                System.out.println(content.child(0).lastElementSibling());                // 该元素的前一个兄弟元素
                System.out.println(content.child(1).previousElementSibling());                // 该元素的下一个兄弟元素
                System.out.println(content.child(0).nextElementSibling());
            }            // 一个元素中的数据            {
                Element content = doc.getElementsByClass("ul-type-1").first().child(0);                // 获取文本内容                System.out.println(content.text());                // 获取tag名字                System.out.println(content.tagName());                // 获取tag对象                System.out.println(content.tag());                // 获取属性字典                System.out.println(content.attributes());                // 获取当前内容当中的html内容                System.out.println(content.html());                // 获取外部的html内容                System.out.println(content.outerHtml());                // 获取属性style的值
                System.out.println(content.attr("style"));
            }            // 使用选择器语法来查找元素            {
                Elements elements = null;                // 通过标签查找元素
                elements = doc.select("a");
                System.out.println(elements);                // 通过id查找元素
                elements = doc.select("#content");
                System.out.println(elements);                // 通过class查找元素
                elements = doc.select(".ul-type-1");
                System.out.println(elements);                // 通过属性查找元素
                elements = doc.select("[href]");
                System.out.println(elements);                // 通过属性前缀查找元素
                elements = doc.select("[^hr]");
                System.out.println(elements);                // 通过属性值来查找元素
                elements = doc.select("[id=notice]");
                System.out.println(elements);                // 匹配属性值开头
                elements = doc.select("[onmouseover^=swit]");
                System.out.println(elements);                
                // 匹配属性值结尾
                elements = doc.select("[onmouseover$=(this)]");
                System.out.println(elements);                
                // 匹配包含了属性值
                elements = doc.select("[onmouseover*=Tab]");
                System.out.println(elements);                
                // 正则表达式匹配
                elements = doc.select("ul[id~=^notice]");
                System.out.println(elements);
            }

        } catch (Exception e) {

            System.out.println(e);
        }
    }
}</element></element></element>

 

#注意

以下地方請自行替換,本人是從本機載入的html

以下是取得元素的幾個情形

 

以上是Jsoup的簡易使用範例的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前By尊渡假赌尊渡假赌尊渡假赌
威爾R.E.P.O.有交叉遊戲嗎?
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。