html - 为什么BeautifulSoup find_all 返回的list都不是按照网页显示顺序排序的？

Question

我想爬糗百的段子，显示作者，和对应的段子，先只爬第一面 {代码...} print 结果： {代码...} html.fromstring xpath 也这样 {代码...} print 结果： {代码...} 但网页的实际显示顺序是: {代码...} 如何让返回的l...

大家讲道理 · Answer

Cela devrait être dû au fait que le tri du contenu sur la page change. Son classement est basé sur le numéro "drôle" dans les commentaires. Les numéros amusants sont proches, l'ordre change normalement, et parfois de nouvelles blagues sont ajoutées à cette page. L’heure à laquelle votre navigateur récupère la page est différente de l’heure à laquelle le robot l’explore. Il est normal que l’ordre des paragraphes que vous voyez soit différent.

html - 为什么BeautifulSoup find_all 返回的list都不是按照网页显示顺序排序的？

répondre à tous(1)je répondrai