Python merangkak data dan mendapat senarai, tetapi bagaimana untuk mengalih keluar tag span di dalamnya?

Question

Saya menggunakan p6ython3.6 untuk merangkak ke bawah beberapa data, tetapi yang akhirnya dipaparkan ialah senarai yang mengandungi teg span Apabila saya menggunakan get_text, kandungan, dll., ralat akan dilaporkan. kenapa ni?
Keputusan awal yang dikembalikan adalah seperti berikut:

仅有的幸福 · Answer

Saya tidak ingat API bs dengan jelas mesti ada fungsi yang boleh mendapatkan teks secara langsung. Ia sepatutnya fungsi get_text(). Memandangkan anda menggunakan find_all(), anda perlu melintasi hasil yang dikembalikan semula, itu sahajaget_text()这个函数吧。由于你用的是find_all(),那么需要再在返回的结果下做一次遍历，就是这样

rs = list()
for data in soup.find("p",{"class":"list-main-eventset-finan"}).find_all("li"):
    contents=data.find("i",{"class":"cell date"}).find_all("span")
    for content in contents:
        rs.append(content.get_text())

此外，也可以使用正则表达式来匹配，直接匹配(.*?)< rrreee Selain itu, anda juga boleh menggunakan ungkapan biasa untuk dipadankan, padanan terus dengan corak (.*?)<. Tetapi anda perlu merentasi senarai kandungan seperti di atas.

phpcn_u1582 · Answer

Penyoal boleh mencuba kaedah text_content()

ringa_lee · Answer

Ekspresi biasa atau split+SUBSTRING juga boleh digunakan, gunakannya secara fleksibel

Python merangkak data dan mendapat senarai, tetapi bagaimana untuk mengalih keluar tag span di dalamnya?

membalas semua(3)saya akan balas