python爬數據，得到一個列表，但怎麼去掉裡面的span標籤呢？

Question

用p6ython3.6爬下了部分數據，但最後顯示的是含span標籤的列表，當我用get_text、contents等方法，就會報錯。這是為什麼呢？
最開始回傳的結果如下：

仅有的幸福 · Answer

bs的API記得不是很清楚了，應該是有可以直接獲取文本的函數的,應該是get_text()这个函数吧。由于你用的是find_all(),那麼需要再在返回的結果下做一次遍歷，就是這樣

rs = list()
for data in soup.find("p",{"class":"list-main-eventset-finan"}).find_all("li"):
    contents=data.find("i",{"class":"cell date"}).find_all("span")
    for content in contents:
        rs.append(content.get_text())

此外，也可以使用正規表示式來匹配，直接匹配(.*?)<這個pattern。但是也得像上面那樣遍歷這個contens列表才行。

phpcn_u1582 · Answer

題主可以試試 text_content() 方法

ringa_lee · Answer

正規表示式或split+SUBSTRING也可以，靈活著用

python爬數據，得到一個列表，但怎麼去掉裡面的span標籤呢？

全部回覆(3)我來回復