BeautifulSoup：將頂級文字與經典標籤查找功能結合？

Question

我正在嘗試使用BeautifulSoup從非統一結構的html區塊中提取資訊。我正在尋找一種方法來組合搜尋/過濾器輸出中標籤之間的文字區塊。例如，來自html：DescriptionSection1

line1
line2

P粉905144514 · Answer

要獲得輸出，您可以先選擇，然後選擇它的next_sibling。

範例

from bs4 import BeautifulSoup html = ''' Description Section1

line1

line2

line3

Section2 Content2 ''' soup = BeautifulSoup(html) data = [] for e in soup.select('strong'): data.extend([e,e.next_sibling.strip()]) data

輸出

[Description, 'Section1', Section2, 'Content2']

BeautifulSoup：將頂級文字與經典標籤查找功能結合？

全部回覆(1)我來回復

範例

輸出