NetEase Cloud Music 다운로드를 위한 매우 간단한 Python 크롤러-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

NetEase Cloud Music 다운로드를 위한 매우 간단한 Python 크롤러

不言

Aug 29, 2018 am 11:57 AM

pythonseleniumNetEase 클라우드 음악

이 기사의 내용은 매우 간단한 Python 크롤러를 사용하여 NetEase Cloud Music을 다운로드하는 것에 관한 것입니다. 이는 특정 참고 가치가 있으므로 도움이 될 수 있습니다.

Goal

우연히 집주인의 고양이의 '구름과 연기가 비로 변한다'를 듣게 되었는데, 나른한 목소리와 학생다운 가사에 순간 매료되어 계속 반복해서 듣게 되었습니다. 그러다가 일부러 '나는 장샤오바이입니다'라는 애니메이션을 봤는데 시즌2도 너무 기대되네요...

잠깐 보고 떠나더라도 꼭 다시 만나고 싶어요...

알았어, 말도 안되는 소리는 하지 말자. 이번 목표는 NetEase Cloud에 있는 가수의 ID를 기반으로 가수의 인기곡 가사와 오디오를 다운로드하여 로컬 폴더에 저장하는 것입니다.

구성 기본

Python
Selenium(구성 방법은 Selenium 구성을 참조하세요.)
Chrome 브라우저(다른 브라우저도 사용 가능하며 그에 따라 수정해야 함)

분석

NetEase Cloud 웹사이트를 방문한 크롤링 친구는 NetEase Cloud에 크롤링 방지 메커니즘이 있다는 것을 알아야 합니다. POST 중에 일부 정보 매개변수에 대한 암호화 기능을 시뮬레이션해야 합니다. 그러나 여기서는 단순함을 위해 초보자도 이해할 수 있습니다. Selenium을 직접 사용하여 로그인을 시뮬레이션한 다음 인터페이스를 사용하여 음악과 가사를 직접 다운로드합니다.

실험 단계:

가수 ID를 기반으로 가수의 인기곡 목록, 노래 이름 및 링크를 가져와서 csv 파일에 저장합니다.
csv 파일을 읽고 노래 ID 기반으로 추출합니다. 노래 링크에서 해당 인터페이스를 사용하여 음악과 가사를 다운로드하세요.
음악과 가사를 로컬에 저장하세요.

NetEase Cloud Music 다운로드를 위한 매우 간단한 Python 크롤러

Python 구현

이 부분에서는 몇 가지 주요 기능을 소개합니다...

가수 정보 가져오기

Selenium을 사용하면 웹 페이지에 대한 요청을 볼 필요가 없습니다. 웹페이지 소스코드에서 해당 정보를 추출하여 직접 접근합니다. 가수 페이지의 소스 코드를 보면 필요한 정보가 iframe 프레임 내에 있다는 것을 알 수 있으므로 먼저 iframe으로 전환해야 합니다.

browser.switch_to.frame('contentFrame')

계속해서 아래를 살펴보고 노래 이름과 링크가 필요한 내용은 id="hotsong-list" 태그에 있고 각 줄은 tr 태그에 해당합니다. 따라서 먼저 모든 tr 콘텐츠를 가져온 다음 단일 tr를 반복합니다. id="hotsong-list"的标签中，然后每一行对应的是一个tr标签。所以先获取所有的tr内容，然后遍历单个tr。

data = browser.find_element_by_id("hotsong-list").find_elements_by_tag_name("tr")

注意：前一个是find_element，后一个是find_elements，后者返回一个列表。

接下来就是解析单个tr标签的内容，获取歌曲名字和链接，可以发现两者在class="txt"标签中，而且链接是href属性，名字是title属性，可以直接通过get_attribute()函数获取。

NetEase Cloud Music 다운로드를 위한 매우 간단한 Python 크롤러

for i in range(len(data)):
    content = data[i].find_element_by_class_name("txt")
    href = content.find_element_by_tag_name("a").get_attribute("href")
    title = content.find_element_by_tag_name("b").get_attribute("title")
    song_info.append((title, href))

下载歌词

网易云有个获取歌词的接口，链接为：http://music.163.com/api/song...

链接中的数字就是歌曲的id，所以我们拥有歌曲id后，可以直接从该链接下载歌词，歌词文件是json格式，所以我们需要用到json

def get_lyric(self):
    url = 'http://music.163.com/api/song/lyric?' + 'id=' + str(self.song_id) + '&lv=1&kv=1&tv=-1'
    r = requests.get(url)
    json_obj = r.text
    j = json.loads(json_obj)
    lyric = j['lrc']['lyric']
    # 利用正则表达式去除时间轴
    regex = re.compile(r'\[.*\]')
    final_lyric = re.sub(regex, '', lyric)
    return final_lyric

참고: 전자는 find_element이고 후자는 find_elements이며 후자는 목록을 반환합니다.

다음 단계는 단일 tr 태그의 내용을 구문 분석하고 노래 이름과 링크를 얻는 것입니다. 둘 다 class="txt"에 있음을 확인할 수 있습니다. 태그이고 링크는 href 속성이고 이름은 title 속성이며 get_attribute() 함수를 통해 직접 얻을 수 있습니다. NetEase Cloud Music 다운로드를 위한 매우 간단한 Python 크롤러

def get_mp3(self): url = 'http://music.163.com/song/media/outer/url?id=' + str(self.song_id)+'.mp3' try: print(">

가사 다운로드

NetEase Cloud에는 가사를 가져오는 인터페이스가 있습니다. 링크는 다음과 같습니다: http://music.163.com/api/song...

링크에 있는 숫자는 노래 ID입니다. 노래 ID가 있으면 이 링크에서 가사를 직접 다운로드할 수 있습니다. 가사 파일은 json 형식이므로 json 패키지를 사용해야 합니다.

그리고 직접 얻은 가사에는 각 줄에 타임라인이 있으므로 정규식을 사용하여 제거해야 합니다. 전체 코드는 다음과 같습니다.

rrreee

오디오 다운로드NetEase Cloud는 다음을 위한 인터페이스도 제공합니다. 오디오 파일 링크는 http://music.163.com/song/med...

🎜링크에 있는 숫자는 해당 곡의 ID를 기준으로 바로 오디오 파일을 다운로드 받으실 수 있습니다. 노래. 전체 코드는 다음과 같습니다. 🎜rrreee🎜관련 권장 사항: 🎜🎜🎜Python을 사용하여 NetEase Cloud Music에서 인기 댓글을 크롤링하는 방법🎜🎜🎜🎜🎜Python이 qq music을 크롤링하는 프로세스의 예🎜🎜

위 내용은 NetEase Cloud Music 다운로드를 위한 매우 간단한 Python 크롤러의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

파이썬과 시간 : 공부 시간을 최대한 활용Apr 14, 2025 am 12:02 AM

제한된 시간에 Python 학습 효율을 극대화하려면 Python의 DateTime, Time 및 Schedule 모듈을 사용할 수 있습니다. 1. DateTime 모듈은 학습 시간을 기록하고 계획하는 데 사용됩니다. 2. 시간 모듈은 학습과 휴식 시간을 설정하는 데 도움이됩니다. 3. 일정 모듈은 주간 학습 작업을 자동으로 배열합니다.

파이썬 : 게임, Guis 등Apr 13, 2025 am 12:14 AM

Python은 게임 및 GUI 개발에서 탁월합니다. 1) 게임 개발은 Pygame을 사용하여 드로잉, 오디오 및 기타 기능을 제공하며 2D 게임을 만드는 데 적합합니다. 2) GUI 개발은 Tkinter 또는 PYQT를 선택할 수 있습니다. Tkinter는 간단하고 사용하기 쉽고 PYQT는 풍부한 기능을 가지고 있으며 전문 개발에 적합합니다.

Python vs. C : 응용 및 사용 사례가 비교되었습니다Apr 12, 2025 am 12:01 AM

Python은 데이터 과학, 웹 개발 및 자동화 작업에 적합한 반면 C는 시스템 프로그래밍, 게임 개발 및 임베디드 시스템에 적합합니다. Python은 단순성과 강력한 생태계로 유명하며 C는 고성능 및 기본 제어 기능으로 유명합니다.

2 시간의 파이썬 계획 : 현실적인 접근Apr 11, 2025 am 12:04 AM

2 시간 이내에 Python의 기본 프로그래밍 개념과 기술을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우기, 2. 마스터 제어 흐름 (조건부 명세서 및 루프), 3. 기능의 정의 및 사용을 이해하십시오. 4. 간단한 예제 및 코드 스 니펫을 통해 Python 프로그래밍을 신속하게 시작하십시오.

파이썬 : 기본 응용 프로그램 탐색Apr 10, 2025 am 09:41 AM

Python은 웹 개발, 데이터 과학, 기계 학습, 자동화 및 스크립팅 분야에서 널리 사용됩니다. 1) 웹 개발에서 Django 및 Flask 프레임 워크는 개발 프로세스를 단순화합니다. 2) 데이터 과학 및 기계 학습 분야에서 Numpy, Pandas, Scikit-Learn 및 Tensorflow 라이브러리는 강력한 지원을 제공합니다. 3) 자동화 및 스크립팅 측면에서 Python은 자동화 된 테스트 및 시스템 관리와 같은 작업에 적합합니다.

2 시간 안에 얼마나 많은 파이썬을 배울 수 있습니까?Apr 09, 2025 pm 04:33 PM

2 시간 이내에 파이썬의 기본 사항을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우십시오. 이를 통해 간단한 파이썬 프로그램 작성을 시작하는 데 도움이됩니다.

10 시간 이내에 프로젝트 및 문제 중심 방법에서 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법?Apr 02, 2025 am 07:18 AM

10 시간 이내에 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법은 무엇입니까? 컴퓨터 초보자에게 프로그래밍 지식을 가르치는 데 10 시간 밖에 걸리지 않는다면 무엇을 가르치기로 선택 하시겠습니까?

중간 독서를 위해 Fiddler를 사용할 때 브라우저에서 감지되는 것을 피하는 방법은 무엇입니까?Apr 02, 2025 am 07:15 AM

Fiddlerevery Where를 사용할 때 Man-in-the-Middle Reading에 Fiddlereverywhere를 사용할 때 감지되는 방법 ...

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

DVWA

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는