使用 BeautifulSoup 依類別找出元素
在網頁抓取中,透過類別屬性在網頁上定位元素是一項常見任務。雖然使用 Beautifulsoup 可以簡化此過程,但某些使用者在存取「class」屬性時可能會遇到 KeyError。本文針對該問題並提供了解決方案。
範例程式碼中遇到的錯誤("File "./beautifulcoding.py", line 130, in getlanguage...", "KeyError: 'class' ") 表示腳本無法從div 元素中擷取class屬性。為了解決這個問題,可以使用 BeautifulSoup 3 改進的 find_all 函數來改進搜尋方法。
以下修改後的程式碼示範如何尋找並列印所有具有特定類別的div 元素:
mydivs = soup.find_all("div", {"class": "stylelistrow"}) for div in mydivs: print(div)
此程式碼透過將所需的類別指定為find_all 方法中的字典參數來優化搜尋。這可確保僅從 HTML 文件中檢索具有指定類別的 div 元素。
以上是使用BeautifulSoup按類別尋找元素時如何避免KeyError?的詳細內容。更多資訊請關注PHP中文網其他相關文章!