Maison > Questions et réponses > le corps du texte
目前在学习Python的数据抓取(爬虫),突发奇想,如果在豆瓣抓取到电影名称后,如何通过获取的电影名称抓取对应的视频URL呢?
本人的流程如下:
1、去豆瓣抓取部分电影名称
2、保存到数据库
3、通过数据库保存的名称去优酷等网站搜索相关电影
4、获取相关电影的视频链接地址
5、把链接地址保存到对应的数据表中。
不知大神有何建议?为感。
大家讲道理2017-04-18 10:23:10
Vous devez déterminer si l'URL explorée correspond à la vidéo que vous souhaitez
怪我咯2017-04-18 10:23:10
Chaque site Web vidéo obtient l'adresse vidéo d'une manière différente, et chacun doit écrire un ensemble correspondant de méthodes d'exploration. Et comme Youku, les vidéos plus volumineuses sont généralement segmentées, même s’il peut y avoir plusieurs URL, il faut aussi en tenir compte.
伊谢尔伦2017-04-18 10:23:10
Vous pouvez l'obtenir directement sur les principaux sites de vidéos. Pourquoi avez-vous besoin d'obtenir le nom de Douban ? score?
Dans des circonstances normales, c'est possible, mais vous devez contrôler le nombre de résultats obtenus. Par exemple, si vous recherchez un film, il peut y avoir de nombreux résultats.
天蓬老师2017-04-18 10:23:10
Si vous explorez des films Douban, ils ont généralement des sources de lecture et vous pouvez directement explorer l'URL