网页爬虫 - python爬虫用BeautifulSoup爬取~~元素并写入字典，但某些div下没有这一元素，导致自动写入下一条，如何解决？~~

Question

新手写二手车网站爬虫，爬卖价和原价，原价以&lt;s&gt;删除线形式放在&lt;p class="priType-s"&gt;下。但是遇到没有标记原价，也就是并没有&lt;s&gt;标签的情况下，会自动把下一个&lt;s&gt;内的信息写入上一条占...

大家讲道理 · Answer

大体思路就是多加选择器，让它为空，然后你做判断

大家讲道理 · Answer

prices0=soup.select('p.list > ul > li > p > p.priType-s > span> i')
prices1=soup.select('p.list > ul > li > p > p.priType-s > span + s')

试试看。
如果再不行就把整段给你拿下来用 regex 来提取

天蓬老师 · Answer

试试这个思路：
1.每一个二手车会有一个块来显示，

..

之类的
2.在每一个块当中，再来进行原价，现价的抓取
这样就不会因一个二手车没有原价而把下一个价位填充到上一个车的原价上

网页爬虫 - python爬虫用BeautifulSoup爬取<s>元素并写入字典，但某些div下没有这一元素，导致自动写入下一条，如何解决？