Maison  >  Article  >  Tutoriel système  >  Utilisez Python pour explorer toutes les informations vidéo de la station B

Utilisez Python pour explorer toutes les informations vidéo de la station B

王林
王林avant
2024-02-19 23:45:35619parcourir

Je pense que tout le monde connaît Station B. En fait, il y a beaucoup de recherches sur le site d'exploration de Station B. Cependant, ce que je lis sur papier est finalement superficiel, et je sais bien que je dois le faire en détail, donc je suis ici. Au final, la quantité totale de données explorées était de 7,6 millions .

Préparation

Ouvrez d’abord la Station B, recherchez une vidéo sur la page d’accueil et cliquez dessus. Pour un fonctionnement normal, ouvrez les outils de développement. Cette fois, l'objectif est d'obtenir des informations vidéo en explorant l'API fournie par la station B sans analyser la page Web. La vitesse d'analyse de la page Web est trop lente et l'adresse IP est facilement bloquée.

Cochez l'option JS et appuyez sur F5 pour actualiser

Utilisez Python pour explorer toutes les informations vidéo de la station B

J'ai trouvé l'adresse de l'API

Utilisez Python pour explorer toutes les informations vidéo de la station B

Copiez-le, supprimez le contenu inutile et obtenez https://api.bilibili.com/x/web-interface/archive/stat?aid=15906633 Ouvrez-le avec un navigateur et vous obtiendrez les données json suivantes

.

Utilisez Python pour explorer toutes les informations vidéo de la station B

Codage pratique

D'accord, le code peut désormais être codé. Les données sont obtenues par itération continue via requête. Afin de rendre le robot d'exploration plus efficace, le multithreading peut être utilisé.

Code de base

Utilisez Python pour explorer toutes les informations vidéo de la station B

Exploration itérative

Utilisez Python pour explorer toutes les informations vidéo de la station B

La partie la plus importante de l'ensemble du projet comprend environ 20 lignes de code, ce qui est assez concis.

L'effet d'exécution est à peu près le suivant : le nombre correspond au nombre de liens qui ont été explorés. En fait, l'intégralité des informations du site peut être explorée en un ou deux jours.

Utilisez Python pour explorer toutes les informations vidéo de la station B

Quant à la façon de le traiter après l'exploration, cela dépend de vos préférences. Je l'enregistre d'abord sous forme de fichier csv, puis je le résume et l'insère dans la base de données.

Table de base de données

Utilisez Python pour explorer toutes les informations vidéo de la station B

Depuis que j'ai exploré ce contenu il y a quelques mois, les données sont en fait un peu en retard.

Quantité totale de données

Utilisez Python pour explorer toutes les informations vidéo de la station B

Vérifiez les dix vidéos les plus jouées

Utilisez Python pour explorer toutes les informations vidéo de la station B

Vérifiez les dix vidéos avec le plus de réponses

Utilisez Python pour explorer toutes les informations vidéo de la station B

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer