Heim > Artikel > Backend-Entwicklung > So laden Sie Kuaishou-Videos in Python herunter
Zuallererst ist Open Fiddler ein HTTP/https-Paketerfassungsartefakt, daher werde ich es hier nicht vorstellen.
Konfigurieren, um https zuzulassen
Konfigurieren, um Remoteverbindungen zuzulassen, d. h. den HTTP-Proxy öffnen
Computer-IP: 192.168.1.110
Stellen Sie dann sicher, dass sich Telefon und Computer in einem lokalen Netzwerk befinden und kommunizieren können. Da ich hier kein Android-Telefon habe, habe ich stattdessen einen Android-Emulator verwendet und der Effekt ist der gleiche.
Öffnen Sie den mobilen Browser und geben Sie 192.168.1.110:8888 ein, die eingestellte Proxy-Adresse. Erst nach der Installation des Zertifikats können Sie Pakete erfassen
Danach Durch die Installation des Zertifikats ändern die WLAN-Einstellungen das Netzwerk und legen den HTTP-Proxy manuell fest.
Nach dem Speichern kann Fiddler die App-Daten erfassen und aktualisieren, und Sie können sehen, dass sie vorhanden sind Viele http-Anfragen. Die allgemeine Schnittstellenadresse ist sehr offensichtlich. Sie können sehen, dass es sich um eine HTTP-Post-Anfrage vom Typ JSON handelt json. Nach der Erweiterung wurde festgestellt, dass es insgesamt 20 sind. Stellen Sie sicher, dass die Videoinformationen korrekt sind, und suchen Sie einen Videolink zum Ansehen.
Dann öffnen Sie Postman zum Testen. Bei der Übermittlung im Formulardatenmodus wird ein Fehler gemeldet
Änderung zu roh
Die Fehlermeldung ist anders.
Die Daten werden erfolgreich zurückgegeben mehrmals und stellen Sie fest, dass jedes Mal die zurückgegebenen Ergebnisse unterschiedlich sind.
Lass uns mit dem Code beginnen
# -*-coding:utf-8-*- # author : Corleone import urllib2,urllib import json,os,re,socket,time,sys import Queue import threading import logging # 日志模块 logger = logging.getLogger("AppName") formatter = logging.Formatter('%(asctime)s %(levelname)-5s: %(message)s') console_handler = logging.StreamHandler(sys.stdout) console_handler.formatter = formatter logger.addHandler(console_handler) logger.setLevel(logging.INFO) video_q = Queue.Queue() # 视频队列 def get_video(): url = "http://101.251.217.210/rest/n/feed/hot?app=0&lon=121.372027&c=BOYA_BAIDU_PINZHUAN&sys=ANDROID_4.1.2&mod=HUAWEI(HUAWEI%20C8813Q)&did=ANDROID_e0e0ef947bbbc243&ver=5.4&net=WIFI&country_code=cn&iuid=&appver=5.4.7.5559&max_memory=128&oc=BOYA_BAIDU_PINZHUAN&ftt=&ud=0&language=zh-cn&lat=31.319303 " data = { 'type': 7, 'page': 2, 'coldStart': 'false', 'count': 20, 'pv': 'false', 'id': 5, 'refreshTimes': 4, 'pcursor': 1, 'os': 'android', 'client_key': '3c2cd3f3', 'sig': '22769f2f5c0045381203fc57d1b5ad9b' } req = urllib2.Request(url) req.add_header("User-Agent", "kwai-android") req.add_header("Content-Type", "application/x-www-form-urlencoded") params = urllib.urlencode(data) try: html = urllib2.urlopen(req, params).read() except urllib2.URLError: logger.warning(u"网络不稳定 正在重试访问") html = urllib2.urlopen(req, params).read() result = json.loads(html) reg = re.compile(u"[\u4e00-\u9fa5]+") # 只匹配中文 for x in result['feeds']: try: title = x['caption'].replace("\n","") name = " ".join(reg.findall(title)) video_q.put([name, x['photo_id'], x['main_mv_urls'][0]['url']]) except KeyError: pass def download(video_q): path = u"D:\快手" while True: data = video_q.get() name = data[0].replace("\n","") id = data[1] url = data[2] file = os.path.join(path, name + ".mp4") logger.info(u"正在下载:%s" %name) try: urllib.urlretrieve(url,file) except IOError: file = os.path.join(path, u"神经病呀"+ '%s.mp4') %id try: urllib.urlretrieve(url, file) except (socket.error,urllib.ContentTooShortError): logger.warning(u"请求被断开,休眠2秒") time.sleep(2) urllib.urlretrieve(url, file) logger.info(u"下载完成:%s" % name) video_q.task_done() def main(): # 使用帮助 try: threads = int(sys.argv[1]) except (IndexError, ValueError): print u"\n用法: " + sys.argv[0] + u" [线程数:10] \n" print u"例如:" + sys.argv[0] + " 10" + u" 爬取视频 开启10个线程 每天爬取一次 一次2000个视频左右(空格隔开)" return False # 判断目录 if os.path.exists(u'D:\快手') == False: os.makedirs(u'D:\快手') # 解析网页 logger.info(u"正在爬取网页") for x in range(1,100): logger.info(u"第 %s 次请求" % x) get_video() num = video_q.qsize() logger.info(u"共 %s 视频" %num) # 多线程下载 for y in range(threads): t = threading.Thread(target=download,args=(video_q,)) t.setDaemon(True) t.start() video_q.join() logger.info(u"-----------全部已经爬取完成---------------") main()Test
Der Multithread-Download lädt jedes Mal etwa 2000 Videos herunter und lädt standardmäßig auf D herunter : Kuaishou
Verwandte Empfehlungen: „
Python-Video-Tutorial“
Das obige ist der detaillierte Inhalt vonSo laden Sie Kuaishou-Videos in Python herunter. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!