Maison >développement back-end >Tutoriel Python >Robot d'exploration Python super simple pour télécharger NetEase Cloud Music
Le contenu de cet article concerne le téléchargement de NetEase Cloud Music à l'aide d'un robot Python super simple. Il a une certaine valeur de référence. Les amis dans le besoin peuvent s'y référer.
Par hasard, j'ai entendu "Clouds and Smoke Turn into Rain" de Landlady's Cat. J'ai été immédiatement fasciné par la voix paresseuse et les paroles étudiantes, puis j'ai continué à écouter. eux en boucle. Ensuite, j'ai délibérément regardé l'anime "Je suis Jiang Xiaobai", et j'ai vraiment hâte de voir la deuxième saison...
Je veux vous revoir, même si je dois partir après juste un rapide coup d'œil...D'accord, pas de bêtises. L'objectif cette fois est de télécharger les paroles et l'audio de la musique populaire du chanteur en fonction de l'identifiant du chanteur dans NetEase Cloud et de l'enregistrer dans un dossier local.
Python
Selenium (se référer à la méthode de configuration : configuration Selenium)
Navigateur Chrome (d'autres sont également disponibles et doivent être modifiés en conséquence)
Si des amis qui ont exploré le site Web de NetEase Cloud vous ont Il faut savoir que NetEase Cloud dispose d'un mécanisme anti-exploration Lors du POST, vous devez simuler la fonction de cryptage de certains paramètres d'informations. Mais ici, par souci de simplicité, les novices peuvent le comprendre. Selenium est utilisé directement pour simuler la connexion, puis l'interface est utilisée pour télécharger directement de la musique et des paroles.
Étapes expérimentales :
Obtenez la liste des chansons populaires du chanteur, les noms des chansons et les liens en fonction de l'identifiant du chanteur, et enregistrez-les dans un fichier CSV fichier ;
Lisez le fichier csv, extrayez l'ID de la chanson en fonction du lien de la chanson, puis utilisez l'interface correspondante pour télécharger la musique et les paroles
Implémentation de PythonCette section présentera plusieurs fonctions clés...Obtenir des informations sur le chanteurEn utilisant Selenium, nous n'avons pas besoin de lire la demande de la page Web, nous pouvons directement extraire les informations correspondantes du code source de la page Web. En regardant le code source de la page du chanteur, nous pouvons constater que les informations dont nous avons besoin se trouvent dans le cadre iframe, nous devons donc d'abord passer à l'iframe :
browser.switch_to.frame('contentFrame')Continuez la lecture et constatez que la chanson le nom et le lien dont nous avons besoin sont dans la balise
, et chaque ligne correspond à une balise id="hotsong-list"
. Alors récupérez d’abord tout le contenu tr
, puis parcourez un seul tr
. tr
data = browser.find_element_by_id("hotsong-list").find_elements_by_tag_name("tr")Remarque : le premier est
, le second est find_element
et le second renvoie une liste. find_elements
et à obtenir le nom et le lien de la chanson. Vous pouvez constater que les deux se trouvent dans la balise tr
et que le lien est le class="txt"
. attribut et le nom est l'attribut href
. Il peut être obtenu directement via la fonction title
. get_attribute()
for i in range(len(data)): content = data[i].find_element_by_class_name("txt") href = content.find_element_by_tag_name("a").get_attribute("href") title = content.find_element_by_tag_name("b").get_attribute("title") song_info.append((title, href))Télécharger les paroles NetEase Cloud a une interface pour obtenir les paroles, le lien est : http://music .163.com/api/song...Le numéro dans le lien est l'identifiant de la chanson, donc après avoir obtenu l'identifiant de la chanson, nous pouvons télécharger les paroles directement à partir du lien. le format
, nous avons donc besoin du package json
. json
De plus, dans les paroles obtenues directement, chaque ligne a une chronologie, qui doit être éliminée à l'aide d'expressions régulières. Le code complet est le suivant. :
def get_lyric(self): url = 'http://music.163.com/api/song/lyric?' + 'id=' + str(self.song_id) + '&lv=1&kv=1&tv=-1' r = requests.get(url) json_obj = r.text j = json.loads(json_obj) lyric = j['lrc']['lyric'] # 利用正则表达式去除时间轴 regex = re.compile(r'\[.*\]') final_lyric = re.sub(regex, '', lyric) return final_lyricTélécharger l'audioNetEase Cloud fournit également une interface pour les fichiers audio, le lien est : http://music.163.com/song/med...Lien Le numéro est l'identifiant de la chanson, et le fichier audio peut être téléchargé directement en fonction de l'identifiant de la chanson. Le code complet est le suivant :
def get_mp3(self): url = 'http://music.163.com/song/media/outer/url?id=' + str(self.song_id)+'.mp3' try: print("正在下载:{0}".format(self.song_name)) urllib.request.urlretrieve(url, '{0}/{1}.mp3'.format(self.path, self.song_name)) print("Finish...") except: print("Fail...")Recommandations associées :
Comment utiliser Python pour explorer les commentaires populaires sur NetEase Cloud Music
Exemple du processus d'exploration de musique qq avec Python
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!