BeautifulSoup：将顶级文本与经典标签查找功能相结合？

Question

我正在尝试使用BeautifulSoup从非统一结构的html块中提取信息。我正在寻找一种方法来组合搜索/过滤器输出中标签之间的文本块。例如，来自html：DescriptionSection1

line1
line2

P粉905144514 · Answer

要获得输出，您可以先选择，然后选择它的next_sibling。

示例

from bs4 import BeautifulSoup html = ''' Description Section1

line1

line2

line3

Section2 Content2 ''' soup = BeautifulSoup(html) data = [] for e in soup.select('strong'): data.extend([e,e.next_sibling.strip()]) data

输出

[Description, 'Section1', Section2, 'Content2']

BeautifulSoup：将顶级文本与经典标签查找功能相结合？

全部回复(1)我来回复

示例

输出