网络爬虫 - python urlopen.read()不完整

Question

这个目的说来有点不忍启齿....不过抱着解决问题的态度，我还是提了这个问题：这个是原网页https://movie.douban.com/tag/%E6%83%85%E8%89%B2?start=0&amp;type=T 这个网页有20个电影，但我抓取的结果只有17个，我...

大家讲道理 · Answer

這個網頁就17部電影。
補充：
未登入狀態下，結果是17條。
登入狀態下，結果是20條。
根據此邏輯，可以透過模擬登錄，解決這個問題。

怪我咯 · Answer

https://movie.douban.com/tag/%E6%83%85%E8%89%B2?start=0&type=T

這個網頁只有17部電影

巴扎黑 · Answer

用chrome的拷貝xpath功能,拷貝最後一個電影的xpath,是第17個.
//*[@id="content"]/p/p[1]/p[2]/table[17]