html - 为什么BeautifulSoup find_all 返回的list都不是按照网页显示顺序排序的？

Question

我想爬糗百的段子，显示作者，和对应的段子，先只爬第一面 {代码...} print 结果： {代码...} html.fromstring xpath 也这样 {代码...} print 结果： {代码...} 但网页的实际显示顺序是: {代码...} 如何让返回的l...

大家讲道理 · Answer

それは、ページ上のコンテンツの並べ替えが変更されているためです。彼のランキングはコメントの「面白い」数に基づいており、面白い数は通常通り変わりますが、時々新しいジョークがこのページに追加されます。ブラウザがページを取得するときと、クローラーがページをクロールするときは異なります。表示される段落の順序が異なるのは正常です。

html - 为什么BeautifulSoup find_all 返回的list都不是按照网页显示顺序排序的？

全員に返信(1)返信します