>백엔드 개발 >파이썬 튜토리얼 >Python은 댓글이 60,000개가 넘는 Leslie Cheung의 가장 인기 있는 8곡을 크롤링했는데, 읽은 후 눈물이 터졌습니다!

Python은 댓글이 60,000개가 넘는 Leslie Cheung의 가장 인기 있는 8곡을 크롤링했는데, 읽은 후 눈물이 터졌습니다!

little bottle
little bottle앞으로
2019-04-02 14:19:082451검색



어제는 4월 1일이었습니다.

매년 이 날,

어떤 사람들은 나를 속이려고 열심히 검색하고,

어떤 사람들은 여전히 ​​여기에 있으면 4월이 좋을 것이라고 생각합니다.

AI를 사용해 회복하는 사람들도 있습니다.

하지만 결국 당신은 아닙니다.

Python은 댓글이 60,000개가 넘는 Leslie Cheung의 가장 인기 있는 8곡을 크롤링했는데, 읽은 후 눈물이 터졌습니다!

사진 출처 워터마크 보기

선생님이 관심을 두지 않는 동안 책상에서 몰래 당신의 노래를 듣던 십대들은 이미 남편과 아내가 되었을지도 모릅니다.

그렇지만 매년 많은 사람들이 4월, 답장을 받지 못할 것을 알면서도 당신이 세상에 남기는 끝없는 울림으로 당신을 그리워하고 메시지를 남기고 있습니다.

640 (1).gif

이제 우리는 내 동생을 기념하기 위해 기술을 사용하기로 선택했습니다.

NetEase Cloud Music에서 댓글이 가장 많은 8곡을 크롤링했습니다.

그들은: "침묵은 황금이다", "봄, 여름, 가을, 겨울", "중국 귀신 이야기", "사랑이 과거일 때", "나", "바람이 계속 불고", "사랑" 유리', '바람이 다시 불 때' 등이 있다.

총 64,540개의 댓글 중 가장 많이 달린 댓글은 "생일 축하해", "형님", "어서", "아직 계시다면", "새해 복 많이 받으세요", "생일 축하해요 형님" 순이었습니다.

Python은 댓글이 60,000개가 넘는 Leslie Cheung의 가장 인기 있는 8곡을 크롤링했는데, 읽은 후 눈물이 터졌습니다!

워드 클라우드 차트에는 '4월 1일'과 '만우절'이라는 단어가 거의 없습니다. 이날 댓글을 달 사람이 적어서가 아니라, 이날은 정말 그렇습니다. 당신에게 "행복"이라고 말하기에는 적합하지 않습니다.

자, 댓글 코드 먼저 보여드릴게요.

# coding:utf-8
import json
import time
import requests
from fake_useragent import UserAgent
import random
import multiprocessing
import sys
#reload(sys)
#sys.setdefaultencoding('utf-8')

ua = UserAgent(verify_ssl=False)

song_list = [{'186453':'春夏秋冬'},{'188204':'沉默是金'},{'188175':'倩女幽魂'},{'188489':'风继续吹'},{'187374':'我'},{'186760':'风雨起时'}]
headers = {
    'Origin':'https://music.163.com',
    'Referer': 'https://music.163.com/song?id=26620756',
    'Host': 'music.163.com',
    'User-Agent': ua.random
}

def get_comments(page,ite):
    # 获取评论信息
    # """
    for key, values in ite.items():
        song_id = key
        song_name = values
    ip_list = [IP列表]
    url = 'http://music.163.com/api/v1/resource/comments/R_SO_4_'+ song_id +'?limit=20&offset=' + str(page)
    proxies = get_random_ip(ip_list)
    try:
        response = requests.get(url=url, headers=headers,proxies=proxies)
    except Exception as e:
        print (page)
        print (ite)
        return 0
    result = json.loads(response.text)
    items = result['comments']
    for item in items:
        # 用户名
        user_name = item['user']['nickname'].replace(',', ',')
        # 用户ID
        user_id = str(item['user']['userId'])
        print(user_id)
        # 评论内容
        comment = item['content'].strip().replace('\n', '').replace(',', ',')
        # 评论ID
        comment_id = str(item['commentId'])
        # 评论点赞数
        praise = str(item['likedCount'])
        # 评论时间
        date = time.localtime(int(str(item['time'])[:10]))
        date = time.strftime("%Y-%m-%d %H:%M:%S", date)

8곡 가사 코드:

import requests
from bs4 import BeautifulSoup
import re
import json
import time
import random
import os

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3355.4 Safari/537.36',
    'Referer': 'http://music.163.com',
    'Host': 'music.163.com'
}


# 获取页面源码
def GetHtml(url):
    try:
        res = requests.get(url=url, headers=headers)
    except:
        return None
    return res.text


# 提取歌手歌词信息
def GetSongsInfo(url):
    print('[INFO]:Getting Songs Info...')
    html = GetHtml(url)
    soup = BeautifulSoup(html, 'lxml')
    links = soup.find('ul', class_='f-hide').find_all('a')
    if len(links) < 1:
        print(&#39;[Warning]:_GetSongsInfo <links> not find...&#39;)
    Info = {&#39;ID&#39;: [], &#39;NAME&#39;: []}
    for link in links:
        SongID = link.get(&#39;href&#39;).split(&#39;=&#39;)[-1]
        SongName = link.get_text()
        Info[&#39;ID&#39;].append(SongID)
        Info[&#39;NAME&#39;].append(SongName)
    # print(Info)
    return Info


def GetLyrics(SongID):
    print(&#39;[INFO]:Getting %s lyric...&#39; % SongID)
    ApiUrl = &#39;http://music.163.com/api/song/lyric?id={}&lv=1&kv=1&tv=-1&#39;.format(SongID)
    html = GetHtml(ApiUrl)
    html_json = json.loads(html)
    temp = html_json[&#39;lrc&#39;][&#39;lyric&#39;]
    rule = re.compile(r&#39;\[.*\]&#39;)
    lyric = re.sub(rule, &#39;&#39;, temp).strip()
    print(lyric)
    return lyric


def main():
    SingerId = input(&#39;Enter the Singer ID:&#39;)
    url = &#39;http://music.163.com/artist?id={}&#39;.format(SingerId)
    # url = "http://music.163.com/artist?id=6457"
    Info = GetSongsInfo(url)
    IDs = Info[&#39;ID&#39;]
    i = 0
    for ID in IDs:
        lyric = GetLyrics(ID)
        SaveLyrics(Info[&#39;NAME&#39;][i], lyric)
        i += 1
        time.sleep(random.random() * 3)
        # print(&#39;[INFO]:All Done...&#39;)


def SaveLyrics(SongName, lyric):
    print(&#39;[INFO]: Start to Save {}...&#39;.format(SongName))
    if not os.path.isdir(&#39;./results&#39;):
        os.makedirs(&#39;./results&#39;)
    with open(&#39;./results/{}.txt&#39;.format(SongName), &#39;w&#39;, encoding=&#39;utf-8&#39;) as f:
        f.write(lyric)

01

"침묵은 황금이다"

틀렸어, 절대 옳지 않아, 항상 진실이야

무슨 말을 하든 내 자리를 지켜줘

항상 침묵이 금이라고 믿으세요


이 노래는 당신이 직접 작곡했습니다.

당시, "탐창 헤게모니"(1986년부터 1989년까지 Alan Tam과 Leslie Cheung이 음악 산업의 지위를 놓고 종합적인 음악 경쟁을 시작했습니다)는 이미 열풍에 돌입했습니다.

싸움을 싫어하는 당신은 야망을 밝히기 위해 노래를 빌려 '침묵은 금빛'을 발표했습니다.

당신은 "당신이 무슨 말을 하든 나는 내 의무를 다할 것이며 항상 침묵이 금이라고 믿습니다."라고 말했습니다.

순결한 사람은 스스로를 정화할 것이고, 당신의 침묵은 당신의 결백을 더욱 보여줄 것입니다.

02

《봄, 여름, 가을, 겨울》

가을이 여기 있으면 참 좋을 텐데

가을 바람이 시원함을 가져다주어도 아름답다

늦가을 가득한 당신 내 꿈

낙엽이 흩날리듯 내 창문을 두드려 보세요


생일 때마다, 새해마다, 이 세상을 떠날 때마다 노래 밑에 댓글이 많이 달릴 거예요.

당신은 4월 1일에 떠났지만 당신을 좋아하는 사람들은 항상 3월 30일, 31일 또는 그 이전에 당신의 음악에 댓글을 달러 옵니다.

당신이 부활하길 바라는 사람이 얼마나 많나요? 충칭에서 당신과 매우 흡사한 택시 운전사를 보고 어쩔 수 없이 사진을 찍는 사람도 있습니다.

당신의 눈빛에 담긴 선명함과 망설임은 세월이 지나도 여전히 잊혀지지 않습니다.

Python은 댓글이 60,000개가 넘는 Leslie Cheung의 가장 인기 있는 8곡을 크롤링했는데, 읽은 후 눈물이 터졌습니다!

03

"중국 귀신 이야기"

인간의 세계에서 꿈은 얼마나 많은 방향을 가질 수 있습니까? "중국 귀신 이야기"에서 당신은 수줍음이 많고 소심한 학자입니다. 밤에 걸을 때 세 개의 등불을 밝히는 사람이지만 햇빛이 Xiaoqian의 영혼을 흩어버릴까 두려워 문 패널을 어깨에 단단히 붙잡고 있습니다.

Xiaoqian이 떠났고 Ning Caichen의 심장도 죽었습니다.

이제 동생이 죽었으니 다른 사람이 Ning Caichen을 연기하면 항상 Wushan 이외의 사람은 Yun이 아니라고 느낍니다.

640 (2).gif

04

"사랑이 과거의 일이 될 때"왜 이해하지 못하시나요
사랑이 있는 한 고통도 있습니다

언젠가는 알게 될 겁니다

내가 없으면 인생은 달라지지 않습니다


"후궁별별"에서 청디이 역을 맡았어요.

어떤 사람들은 당신이 동자공 태생이라고 주장할 정도로 연기를 너무 매력적으로 하더군요.

사실 몸이 좋지 않은데도 훈련을 계속하고 계시네요.

당신이 "미치지 않으면 살아남지 못할 것이다"라고 말했기 때문에 Duan Xiaolou가 아내를 얻은 후에는 질투하고 슬프고 미치게 될 것이라는 것을 알고 있습니다.

당신은 화면 안팎에서 나를 사랑해 주셨는데요. "사랑이 있는 한 고통도 있을 것이다"라고 하셨는데, 그것은 마치 자기 자신에게 노래하는 것과 같습니다.

Python은 댓글이 60,000개가 넘는 Leslie Cheung의 가장 인기 있는 8곡을 크롤링했는데, 읽은 후 눈물이 터졌습니다!

너무 순수하고 '죽음을 받아들인' 모습이라 팬들이 늘 안타까워하는데...

05


"나"

마치 외로운 사막에 있는 것 같아요 벌거벗고 활짝 피어

유리집에서 행복하게 살 수 있어서 얼마나 행복해요

빛과 명예에 대해 세상에 무엇을 전하고 있나요?

나는 나다, 다양한 색깔의 불꽃놀이


얼마나 많은 사람들이 사용하는가? "나는 나야, 나는 다양한 색의 불꽃이야"를 부르며 인생을 살아갈 용기를 줬어요.

그런데 결국 너는 불꽃처럼 세상을 떠났다.

몇 년 전 양조위가 콘서트에서 당신을 추모하며 당신의 전화번호를 눌렀습니다.

전화에는 "안녕하세요. 레슬리입니다. 필요한 사항이 있으면 메시지를 남겨주세요"라는 음성 메시지가 남아있었습니다.

Python은 댓글이 60,000개가 넘는 Leslie Cheung의 가장 인기 있는 8곡을 크롤링했는데, 읽은 후 눈물이 터졌습니다!

토니 렁은 침묵을 지킨 뒤, 잠시 후 가볍게 말했다. , 처음부터 시작하는 게 어때요."

06


《바람이 계속 분다》

바람이 계속 불어 더 이상 버틸 수가 없다

당신을 보면 눈물이 나고 싶지 않은 마음이 있어요

과거에 행복했던 기억이 너무 많아요

당신과 함께 있지 않겠습니까? 함께 쫓아가자


이것 는 당신의 유명한 노래인데, 당신은 그것을 매우 좋아하는 것 같습니다.

콘서트에 갈 때마다 노래를 불러야 해요.

마지막으로 노래를 부를 때, 당신도 왠지 울었고, 관객들도 당신과 함께 울었습니다.

Python은 댓글이 60,000개가 넘는 Leslie Cheung의 가장 인기 있는 8곡을 크롤링했는데, 읽은 후 눈물이 터졌습니다!

Python은 댓글이 60,000개가 넘는 Leslie Cheung의 가장 인기 있는 8곡을 크롤링했는데, 읽은 후 눈물이 터졌습니다!

이 노래는 당신의 반전에 대한 간증이니까요.

당신은 오랜 세월 가요계에 몸담아왔지만 늘 침묵을 지켰습니다. 이 노래가 당신을 묻히는 걸 막았죠.

07


"유리 사랑"

눈물이 당신을 다시 사랑에 빠지게 할 수 있다는 걸 믿지 않아요

회수하기 힘든 물이 감정을 퍼뜨릴 것입니다

만약 너무 지쳤으니 시간 맞춰 작별 인사하세요 죄가 없습니다


노래를 부를 때마다 노래에 대한 이야기를 만들어야 한다고 말씀하셨는데, 노래를 부르면 그 이야기의 그림이 떠오릅니다. 그리고 이러한 그림감은 당신을 노래에 푹 빠지게 만듭니다.

네 노래가 영원히 남는 이유는 사람뿐만 아니라 노래에도 큰 중요성을 두기 때문이다.

08

"다시 바람이 불면"

어떤 해를 되돌아본다

바랜 사진이 갑자기 내 눈앞에 나타난 것처럼

멍하고 혼란스러운 청년

매일 노래하는 일에 평생을 바쳐 변하지 않고 싶습니다


1989년, 연예계에서 우여곡절을 너무 많이 겪었던 당신은 갑자기 가요계와 이별을 선언했습니다.

당신은 소란스러운 상황을 보았지만 그 소란스러운 상황에 속해 있지는 않습니다.

고별 콘서트를 계획하기 전에 뮤지션 Chen Shaoqi, Li Xiaotian과 논의를 하셨습니다.

첸샤오치는 "'바람이 계속 분다'라는 유명한 곡이 있지 않나요? 그냥 '바람이 다시 불면'이라고 부르면 어떨까요. 바람이 다시 불 때마다 팬들이 생각나셨으면 좋겠습니다. 당신의 노래."

내 옆에 있는 Li Xiaotian은 임의의 종이에 음악 한 곡을 작곡하는 데 15분을 보냈습니다.

곧 Chen Shaoqi도 단어를 채웠습니다.

어떤 사람들은 이 노래의 가사가 당신을 위해 맞춤 제작되었다고 말합니다. "나는 어느 한 해를 되돌아본다. 마치 빛 바랜 사진이 갑자기 눈앞에 나타난 것처럼. 이 멍하고 혼란스러운 청년은 기꺼이 노래를 끝까지 부른다. 그의 삶과 변함없이 매일 헌신합니다.”

내 평생을 노래에 바치고 영원히 매일을 바칠 수 있기를...

640 (3).gif


지금도 노래를 부르고 계시는지 궁금하네요? 아직도 연기하고 있나요?

많은 분들이 당신을 생각하고 있다는 사실을 알고 계시나요?

많은 노래와 영화를 남겨주셔서 감사합니다.

다른 세상에서는 절대 우울하거나 슬퍼하지 않기를 바랍니다.

위.

이 기사는 여기서 끝났습니다. 더 흥미로운 콘텐츠를 보려면 PHP 중국어 웹사이트의 Python Video Tutorial 칼럼을 주목하세요! ! !

위 내용은 Python은 댓글이 60,000개가 넘는 Leslie Cheung의 가장 인기 있는 8곡을 크롤링했는데, 읽은 후 눈물이 터졌습니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 程序人生 coder_life에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제