Python crawlt die Daten und erhält eine Liste, aber wie entfernt man das Span-Tag darin?

Question

Ich habe p6ython3.6 verwendet, um einige Daten herunterzusuchen, aber was letztendlich angezeigt wurde, war eine Liste mit Span-Tags. Wenn ich get_text, Inhalte usw. verwendete, wurde ein Fehler gemeldet. Warum ist das?
Die ersten zurückgegebenen Ergebnisse lauten wie folgt:

仅有的幸福 · Answer

bs的API记得不是很清楚了，应该是有可以直接获取文本的函数的,应该是get_text()这个函数吧。由于你用的是find_all(),那么需要再在返回的结果下做一次遍历，就是这样

rs = list()
for data in soup.find("p",{"class":"list-main-eventset-finan"}).find_all("li"):
    contents=data.find("i",{"class":"cell date"}).find_all("span")
    for content in contents:
        rs.append(content.get_text())

此外，也可以使用正则表达式来匹配，直接匹配(.*?)<这个pattern。但是也得像上面那样遍历这个contens列表才行。

phpcn_u1582 · Answer

题主可以试试 text_content() 方法

ringa_lee · Answer

正则表达式或者split+SUBSTRING也可以，灵活着用

Python crawlt die Daten und erhält eine Liste, aber wie entfernt man das Span-Tag darin?

Antworte allen(3)Ich werde antworten