Python實作：如何取得網站中所有XPath的樹狀結構？

Question

方法一在嘗試使用Python獲取網站(https://startpagina.nl)中所有xpath的分層樹時，我首先嘗試使用以下方法獲取分支的xpath：/html/body：fromseleniumimportwebdriverurl='https://startpagina .nl'driver=webdriver.Firefox()driver.get(url)test=driver.fin

P粉127901279 · Answer

選擇一個或多個元素的XPath 總數是無限的（例如，它將包括像/a/b/../b/../b/../b 這樣的路徑），但是如果您限制將自己加到/a[i]/b[j]/c[k] 形式的路徑，則路徑數等於元素數，並且XPaths 的「樹」與原始XML樹同構.

如果您想要不帶數字謂詞的不同路徑，例如/a/b/c、/a/b/d，那麼最簡單的方法可能是遍歷XML 文檔，取得每個元素的路徑（以這種形式）並消除重複項。如果您想要樹結構而不是簡單的路徑列表，請使用嵌套地圖/字典來建立它。

它抱怨 /html/body/ 的原因是合法的 XPath 表達式不能包含尾隨 /。

Python實作：如何取得網站中所有XPath的樹狀結構？

方法一

方法二

問題

預期輸出

全部回覆(1)我來回復