ホームページ >バックエンド開発 >Python チュートリアル >Python は、レスリー チャンの最も人気のある 8 曲を 60,000 件のコメントとともにクロールしており、読んだ後、私は泣き出しました。
昨日は4月1日でした。
毎年この日、
一生懸命検索したり、いたずらを考えたりする人もいます。
あなたがまだここにいるなら、4 月がいいな、と思う人もいます。
AIを使ってあなたを復元する人さえいます。
しかし、結局のところ、それはあなたではありません。
画像ソースについては透かしを参照してください
あなたが去ってから 16 年が経ちました。先生がいないときに机でこっそりあなたの曲を聴いていたティーンエイジャーたち。気に留めていませんが、おそらく彼女は長い間夫と妻でした。
それでも、毎年多くの人が、4月にあなたが世界に残した無限の反響を通して、あなたを懐かしんでメッセージを残してくれます。
今、私たちは兄弟を追悼するためにテクノロジーを利用することを選択しました。
NetEase Cloud Music で最もコメントの多い 8 曲をクロールしました。
それらは次のとおりです: 「沈黙は黄金」、「春夏秋冬」、「チャイニーズ・ゴースト・ストーリー」、「愛が過去になったとき」、「ミー」、「風が吹き続けている」 』『ガラスの恋』『風が再び立ち上がるとき』。
合計64,540件のコメントのうち、最も多かったコメントは「お誕生日おめでとう」「お兄さん」「頑張れ」「まだここにいるなら」「明けましておめでとうございます」「お誕生日おめでとう」でした。 、 兄弟。"
ワード クラウド チャートに「4 月 1 日」や「エイプリル フール」などの単語がほとんどありません。これは、この日にコメントする人が少ないからではありません。でも、この日は本当にあなたに「幸せ」って言える時期ではないからです。
さあ、まずはコメントのコードをお見せしましょう。
# coding:utf-8 import json import time import requests from fake_useragent import UserAgent import random import multiprocessing import sys #reload(sys) #sys.setdefaultencoding('utf-8') ua = UserAgent(verify_ssl=False) song_list = [{'186453':'春夏秋冬'},{'188204':'沉默是金'},{'188175':'倩女幽魂'},{'188489':'风继续吹'},{'187374':'我'},{'186760':'风雨起时'}] headers = { 'Origin':'https://music.163.com', 'Referer': 'https://music.163.com/song?id=26620756', 'Host': 'music.163.com', 'User-Agent': ua.random } def get_comments(page,ite): # 获取评论信息 # """ for key, values in ite.items(): song_id = key song_name = values ip_list = [IP列表] url = 'http://music.163.com/api/v1/resource/comments/R_SO_4_'+ song_id +'?limit=20&offset=' + str(page) proxies = get_random_ip(ip_list) try: response = requests.get(url=url, headers=headers,proxies=proxies) except Exception as e: print (page) print (ite) return 0 result = json.loads(response.text) items = result['comments'] for item in items: # 用户名 user_name = item['user']['nickname'].replace(',', ',') # 用户ID user_id = str(item['user']['userId']) print(user_id) # 评论内容 comment = item['content'].strip().replace('\n', '').replace(',', ',') # 评论ID comment_id = str(item['commentId']) # 评论点赞数 praise = str(item['likedCount']) # 评论时间 date = time.localtime(int(str(item['time'])[:10])) date = time.strftime("%Y-%m-%d %H:%M:%S", date)
8 曲の歌詞コード:
import requests from bs4 import BeautifulSoup import re import json import time import random import os headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3355.4 Safari/537.36', 'Referer': 'http://music.163.com', 'Host': 'music.163.com' } # 获取页面源码 def GetHtml(url): try: res = requests.get(url=url, headers=headers) except: return None return res.text # 提取歌手歌词信息 def GetSongsInfo(url): print('[INFO]:Getting Songs Info...') html = GetHtml(url) soup = BeautifulSoup(html, 'lxml') links = soup.find('ul', class_='f-hide').find_all('a') if len(links) < 1: print('[Warning]:_GetSongsInfo <links> not find...') Info = {'ID': [], 'NAME': []} for link in links: SongID = link.get('href').split('=')[-1] SongName = link.get_text() Info['ID'].append(SongID) Info['NAME'].append(SongName) # print(Info) return Info def GetLyrics(SongID): print('[INFO]:Getting %s lyric...' % SongID) ApiUrl = 'http://music.163.com/api/song/lyric?id={}&lv=1&kv=1&tv=-1'.format(SongID) html = GetHtml(ApiUrl) html_json = json.loads(html) temp = html_json['lrc']['lyric'] rule = re.compile(r'\[.*\]') lyric = re.sub(rule, '', temp).strip() print(lyric) return lyric def main(): SingerId = input('Enter the Singer ID:') url = 'http://music.163.com/artist?id={}'.format(SingerId) # url = "http://music.163.com/artist?id=6457" Info = GetSongsInfo(url) IDs = Info['ID'] i = 0 for ID in IDs: lyric = GetLyrics(ID) SaveLyrics(Info['NAME'][i], lyric) i += 1 time.sleep(random.random() * 3) # print('[INFO]:All Done...') def SaveLyrics(SongName, lyric): print('[INFO]: Start to Save {}...'.format(SongName)) if not os.path.isdir('./results'): os.makedirs('./results') with open('./results/{}.txt'.format(SongName), 'w', encoding='utf-8') as f: f.write(lyric)
01
「沈黙は黄金」
02
#あなたの誕生日が来るたび、新年が来るたび、またはこの世を去るたびに、あなたの曲の下にはたくさんのコメントが表示されるでしょう。
あなたは 4 月 1 日に去ってしまいましたが、あなたを好きな人はいつも 3 月 30 日か 31 日、またはそれより前にあなたの音楽にコメントしに来ます。
あなたの復活を願っている人は非常に多く、重慶であなたによく似たタクシー運転手を見かけ、思わず写真を撮った人もいます。
あなたの目の透明感とためらいは、何年も経った今でも忘れられません。
#03##《中国の怪談》
美しい夢レッドダストの中で いくつの方向がある
狂おしい夢の愛を探して
道は人々で果てしなく続く
「中国の怪談」では、あなたは恥ずかしがり屋です 気弱な学者は、夜に歩くときに3つのランタンに火を灯しますが、日光がシャオチェンの魂を散らすことを恐れて、彼はドアパネルを肩にしっかりと保持していました。Xiaoqianは去り、Ning Caichenの心臓は亡くなりました。
私の兄はもういないので、別の人がニン・カイチェンを演じると、いつもウーシャンはユンではないと感じます。
04
なぜわかりませんか
愛がある限り痛みはあります
いつかわかるでしょう
人生は私なしでは変わりません
「さらば我が愛妾」ではチェン・ディイーを演じましたね。
あなたはあまりにも魅力的に振る舞ったので、一部の人はあなたが同子貢生まれであると主張しました。
実は、あなたは重病を抱えながらもトレーニングを続けているんです。
あなたは「狂わなければ生き残れない」と言っていたので、Duan Xiaolouが妻と結婚した後、彼は嫉妬し、悲しく、狂うことになることを知っています。
あなたは画面の中でも外でも愛してきました。「愛がある限り痛みはある」とおっしゃっていましたが、それは自分自身に歌っているようなものです。
あなたはとても純粋で「死を受け入れる」ので、ファンはいつもあなたを残念に思っています...
05
《我》
孤独な砂漠に咲く同じ裸体
なんと幸せ 幸せに生きるガラスの家の中
#世界にとって光と地上とは何なのか
私は私は色とりどりの花火です
何人あなたが歌った「私は私で、色とりどりの花火のように」というフレーズを使って、自分自身を励まし、自分の人生を生きてください。
でも結局、あなたは花火のようにこの世を去りました。
数年前、トニー・レオンはあなたを記念するコンサートであなたの電話番号にダイヤルしました。
電話には、「こんにちは、私はレスリーです。何か必要なことがあればメッセージを残してください。」というメッセージがまだ残っていました。
梁Chaowei は沈黙し、しばらくしてから静かに言いました。 例文: 「バオロン、最初から始めましょうか。」
06
《风が吹き続ける》
#風が吹き続けて、離れるのが耐えられない
私の心には涙があふれていますが、あなたを見ていると涙を流したくありません
#過去にはとてもたくさんの幸せな思い出あなたと一緒に追いかけてみませんか07
#あなたはかつて、歌うたびにその曲のストーリーを作らなければならないと言いました。歌うと、ストーリーのイメージが頭の中に浮かび上がります。この絵の感覚はとても歌に没入できます。
あなたの曲が永遠に残る理由は、あなたが人だけでなく、歌をとても大切にしているからです。
08
《風がまた立ち上がるとき》
私はあることを振り返ります。年
色褪せた写真が目の前に現れるように
##混乱する少年##毎日歌うことに人生を捧げても変わらないように
# 1989年、あまりにも浮き沈みの激しいエンターテインメント業界を経て、あなたは突然音楽業界との決別を発表しました。
あなたは喧騒を見てきましたが、その喧騒の一部ではありません。
お別れコンサートを計画する前に、ミュージシャンのチェン・シャオチーとリー・シャオティアンとそれについて話し合いました。
チェン・シャオチーは言いました、「『風が吹き続ける』という有名な曲はありませんか?それを『風がまた吹くとき』と名付けたらどうでしょうか?風がまた吹くと、ファンはあなたのことを思い出すだろう。「歌。」
一生歌って毎日を捧げて生きていけますように…
Python ビデオ チュートリアル
列に注目してください。 ! !以上がPython は、レスリー チャンの最も人気のある 8 曲を 60,000 件のコメントとともにクロールしており、読んだ後、私は泣き出しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。