찾다

 >  Q&A  >  본문

python爬虫 - python爬取豆瓣电影,无法抓取到内容

代码:

# /usr/bin/python
#coding:utf-8
__author__ = 'eyu Fanne'

import requests,re
from bs4 import BeautifulSoup

move_url = 'https://movie.douban.com/'

def Robot():
    res_url = requests.get(move_url)
    print res_url.status_code
    soup = BeautifulSoup(res_url.text,'lxml')
    print soup.title
    soup_a = soup.find_all("a",class_="item")
    for i in soup_a:
        print i
    print soup_a



if __name__=='__main__':
    Robot()

结果:
200
<title>

    豆瓣电影

</title>
[]

抓取

<a class='item' ....>

这个标签内的值,但获取到的空,这是为何。

阿神阿神2817일 전1128

모든 응답(2)나는 대답할 것이다

  • 大家讲道理

    大家讲道理2017-04-17 17:07:11

    페이지 소스 코드를 확인해보세요. 영화 정보가 없습니다. 실제로 페이지에서 JS에 의해 렌더링됩니다.
    이 링크를 확인하실 수 있습니다 https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start=0

    회신하다
    0
  • 天蓬老师

    天蓬老师2017-04-17 17:07:11

    Douban Movies에는 공개 API 인터페이스가 있습니다. . 페이지를 크롤링하는 이유는 무엇인가요? .
    http://developers.douban.com/wiki/?title=movie_v2

    회신하다
    0
  • 취소회신하다