提取多个没有类的span元素中的文本 - 使用BeautifulSoup

Question

这就是HTML的样子：detail11detail2detail3

P粉041856955 · Answer

在你的情况下，选择更具体的元素，即选择所有具有class为number的元素的兄弟元素：

soup.select('span.number ~ span')

示例

from bs4 import BeautifulSoup
html='''
detail1
1
detail2
detail3
'''
soup = BeautifulSoup(html)

[t.text for t in soup.select('span.number ~ span')]

输出

['detail2', 'detail3']

P粉099145710 · Answer

您可以找到所有的并进行普通索引：

from bs4 import BeautifulSoup

html_doc = """\

detail1
1
detail2
detail3
"""

soup = BeautifulSoup(html_doc, "html.parser")

spans = soup.find("p", class_="details").find_all("span")

for s in spans[-2:]:
    print(s.text)

输出结果：

detail2
detail3

或者使用 CSS 选择器：

spans = soup.select(".details span:nth-last-of-type(-n+2)")

for s in spans:
    print(s.text)

输出结果：

detail2
detail3

提取多个没有类的span元素中的文本 - 使用BeautifulSoup

全部回复(2)我来回复

示例

输出