BeautifulSoup: Gabungkan teks peringkat atas dengan fungsi carian teg klasik?

Question

Saya cuba menggunakan BeautifulSoup untuk mengekstrak maklumat daripada blok html berstruktur tidak seragam. Saya sedang mencari cara untuk menggabungkan blok teks antara tag dalam output carian/penapis. Contohnya, daripada html: PeneranganBahagian1

baris1
baris2

P粉905144514 · Answer

Untuk mendapatkan output, anda boleh pilih ，然后选择它的next_sibling dahulu.

Contoh

from bs4 import BeautifulSoup html = ''' Description Section1

line1

line2

line3

Section2 Content2 ''' soup = BeautifulSoup(html) data = [] for e in soup.select('strong'): data.extend([e,e.next_sibling.strip()]) data

Output

[Description, 'Section1', Section2, 'Content2']

BeautifulSoup: Gabungkan teks peringkat atas dengan fungsi carian teg klasik?

membalas semua(1)saya akan balas

Contoh

Output