ホームページ  >  記事  >  バックエンド開発  >  NetEase Cloud の音楽レビューのクロール

NetEase Cloud の音楽レビューのクロール

jacklove
jackloveオリジナル
2018-06-11 23:42:122712ブラウズ

# coding=gbk
import requests
import json
c='网易云爬虫实战一'
print(c)
music_url = 'https://music.163.com/#/song?id=28815250'
id = music_url.split('=')[1]
# print(id)
url = 'https://music.163.com/weapi/v1/resource/comments/R_SO_4_%s?csrf_token=7e19029fe28aa3e09cfe87e89d2e4eeb' %(id)


headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36',
    'Referer': 'https://music.163.com/song?id=%s' %(id),
    'Origin': 'https://music.163.com',
    }


formdata = {
    'params': 'AoF/ZXuccqvtaCMCPHecFGVPfrbtDj4JFPJsaZ3tYn9J+r0NcnKPhZdVECDz/jM+1CpA+ByvAO2J9d44B/MG97WhjmxWkfo4Tm++AfyBgK11NnSbKsuQ5bxJR6yE0MyFhU8sPq7wb9DiUPFKs2ulw0GxwU/il1NS/eLrq+bbYikK/cyne90S/yGs6ldxpbcNd1yQTuOL176aBZXTJEcGkfbxY+mLKCwScAcCK1s3STo=',
    'encSecKey': '365b4c31a9c7e2ddc002e9c42942281d7e450e5048b57992146633181efe83c1e26acbc8d84b988d746370d788b6ae087547bace402565cca3ad59ccccf7566b07d364aa1d5b2bbe8ccf2bc33e0f03182206e29c66ae4ad6c18cb032d23f1793420ceda05e796401f170dbdb825c20356d27f07870598b2798f8d344807ad6f2',
    }


response = requests.post(url, headers = headers, data = formdata)
messages = json.loads(response.text)


data_list=[]
data={}
for message in messages['hotComments']:
	data['nickname']=message['user']['nickname']
	data['content']=message['content']
	data_list.append(data)
	data={}
#print(data_list)
for i in data_list:
	c = '    '+i['nickname']+':'+i['content']
	print('\n\n'+c.replace('\n',''))


#概要:

1. 最初の行の「#」 coding=gbk" は、テキスト エディターにテキスト文字列を入力できることを意味します。

2. 「id = music_url.split('=')[1]」の split() 関数は要素をグループ化することを意味します。この例では「

https://music.163」です。 .com /#/song?id=", "28815250"

3. リクエスト モジュールによって取得された HTML テキストは、json を使用して Python で読み取り可能な形式に変換する必要があります。それ以外の場合は、エラーが報告されます。 jupyter ノートブックではこのようなことは起こりません。

4. replace() 関数は文字列から要素を削除できます。この例では、改行文字が空に変更されます。

最終的な表示結果は次のとおりです。


##この記事では、NetEase Cloud 音楽レビュー クロールの関連コンテンツを紹介します。 php中国語ウェブサイトに従ってください。

関連する推奨事項:

シンプルな PHP MySQL ページング クラス

再帰なしの 2 つのツリー配列コンストラクター


HTMLをExcelに変換し、印刷・ダウンロード機能を実現

以上がNetEase Cloud の音楽レビューのクロールの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。