Heim >Backend-Entwicklung >Python-Tutorial >So laden Sie Kuaishou-Videos in Python herunter

So laden Sie Kuaishou-Videos in Python herunter

尚Original: 2019-06-24 17:38:315483Durchsuche

Zuallererst ist Open Fiddler ein HTTP/https-Paketerfassungsartefakt, daher werde ich es hier nicht vorstellen.

Konfigurieren, um https zuzulassen

So laden Sie Kuaishou-Videos in Python herunter

Konfigurieren, um Remoteverbindungen zuzulassen, d. h. den HTTP-Proxy öffnen

So laden Sie Kuaishou-Videos in Python herunter

Computer-IP: 192.168.1.110

Stellen Sie dann sicher, dass sich Telefon und Computer in einem lokalen Netzwerk befinden und kommunizieren können. Da ich hier kein Android-Telefon habe, habe ich stattdessen einen Android-Emulator verwendet und der Effekt ist der gleiche.

Öffnen Sie den mobilen Browser und geben Sie 192.168.1.110:8888 ein, die eingestellte Proxy-Adresse. Erst nach der Installation des Zertifikats können Sie Pakete erfassen

So laden Sie Kuaishou-Videos in Python herunter

Danach Durch die Installation des Zertifikats ändern die WLAN-Einstellungen das Netzwerk und legen den HTTP-Proxy manuell fest.

So laden Sie Kuaishou-Videos in Python herunter

Nach dem Speichern kann Fiddler die App-Daten erfassen und aktualisieren, und Sie können sehen, dass sie vorhanden sind Viele http-Anfragen. Die allgemeine Schnittstellenadresse ist sehr offensichtlich. Sie können sehen, dass es sich um eine HTTP-Post-Anfrage vom Typ JSON handelt json. Nach der Erweiterung wurde festgestellt, dass es insgesamt 20 sind. Stellen Sie sicher, dass die Videoinformationen korrekt sind, und suchen Sie einen Videolink zum Ansehen.

So laden Sie Kuaishou-Videos in Python herunter

Dann öffnen Sie Postman zum Testen. Bei der Übermittlung im Formulardatenmodus wird ein Fehler gemeldet

So laden Sie Kuaishou-Videos in Python herunter

Änderung zu roh

So laden Sie Kuaishou-Videos in Python herunter

Die Fehlermeldung ist anders.

So laden Sie Kuaishou-Videos in Python herunter

Die Daten werden erfolgreich zurückgegeben mehrmals und stellen Sie fest, dass jedes Mal die zurückgegebenen Ergebnisse unterschiedlich sind.

Lass uns mit dem Code beginnen So laden Sie Kuaishou-Videos in Python herunter

# -*-coding:utf-8-*-
# author : Corleone
import urllib2,urllib
import json,os,re,socket,time,sys
import Queue
import threading
import logging
# 日志模块
logger = logging.getLogger("AppName")
formatter = logging.Formatter(&#39;%(asctime)s %(levelname)-5s: %(message)s&#39;)
console_handler = logging.StreamHandler(sys.stdout)
console_handler.formatter = formatter
logger.addHandler(console_handler)
logger.setLevel(logging.INFO)
video_q = Queue.Queue()    # 视频队列
def get_video():
    url = "http://101.251.217.210/rest/n/feed/hot?app=0&lon=121.372027&c=BOYA_BAIDU_PINZHUAN&sys=ANDROID_4.1.2&mod=HUAWEI(HUAWEI%20C8813Q)&did=ANDROID_e0e0ef947bbbc243&ver=5.4&net=WIFI&country_code=cn&iuid=&appver=5.4.7.5559&max_memory=128&oc=BOYA_BAIDU_PINZHUAN&ftt=&ud=0&language=zh-cn&lat=31.319303 "
    data = {
        &#39;type&#39;: 7,
        &#39;page&#39;: 2,
        &#39;coldStart&#39;: &#39;false&#39;,
        &#39;count&#39;: 20,
        &#39;pv&#39;: &#39;false&#39;,
        &#39;id&#39;: 5,
        &#39;refreshTimes&#39;: 4,
        &#39;pcursor&#39;: 1,
        &#39;os&#39;: &#39;android&#39;,
        &#39;client_key&#39;: &#39;3c2cd3f3&#39;,
        &#39;sig&#39;: &#39;22769f2f5c0045381203fc57d1b5ad9b&#39;
    }
    req = urllib2.Request(url)
    req.add_header("User-Agent", "kwai-android")
    req.add_header("Content-Type", "application/x-www-form-urlencoded")
    params = urllib.urlencode(data)
    try:
        html = urllib2.urlopen(req, params).read()
    except urllib2.URLError:
        logger.warning(u"网络不稳定 正在重试访问")
        html = urllib2.urlopen(req, params).read()
    result = json.loads(html)
    reg = re.compile(u"[\u4e00-\u9fa5]+")   # 只匹配中文
    for x in result[&#39;feeds&#39;]:
        try:
            title = x[&#39;caption&#39;].replace("\n","")
            name = " ".join(reg.findall(title))
            video_q.put([name, x[&#39;photo_id&#39;], x[&#39;main_mv_urls&#39;][0][&#39;url&#39;]])
        except KeyError:
            pass
def download(video_q):
    path = u"D:\快手"
    while True:
        data = video_q.get()
        name = data[0].replace("\n","")
        id = data[1]
        url = data[2]
        file = os.path.join(path, name + ".mp4")
        logger.info(u"正在下载：%s" %name)
        try:
            urllib.urlretrieve(url,file)
        except IOError:
            file = os.path.join(path, u"神经病呀"+ &#39;%s.mp4&#39;) %id
            try:
                urllib.urlretrieve(url, file)
            except (socket.error,urllib.ContentTooShortError):
                logger.warning(u"请求被断开，休眠2秒")
                time.sleep(2)
                urllib.urlretrieve(url, file)
        logger.info(u"下载完成：%s" % name)
        video_q.task_done()
def main():
    # 使用帮助
    try:
        threads = int(sys.argv[1])
    except (IndexError, ValueError):
        print u"\n用法: " + sys.argv[0] + u" [线程数:10] \n"
        print u"例如：" + sys.argv[0] + " 10" + u"  爬取视频 开启10个线程 每天爬取一次 一次2000个视频左右(空格隔开)"
        return False
    # 判断目录
    if os.path.exists(u&#39;D:\快手&#39;) == False:
        os.makedirs(u&#39;D:\快手&#39;)
    # 解析网页
    logger.info(u"正在爬取网页")
    for x in range(1,100):
        logger.info(u"第 %s 次请求" % x)
        get_video()
    num = video_q.qsize()
    logger.info(u"共 %s 视频" %num)
    # 多线程下载
    for y in range(threads):
        t = threading.Thread(target=download,args=(video_q,))
        t.setDaemon(True)
        t.start()
    video_q.join()
    logger.info(u"-----------全部已经爬取完成---------------")
main()

Test

Der Multithread-Download lädt jedes Mal etwa 2000 Videos herunter und lädt standardmäßig auf D herunter : Kuaishou

So laden Sie Kuaishou-Videos in Python herunter

Verwandte Empfehlungen: „

Python-Video-Tutorial

“ So laden Sie Kuaishou-Videos in Python herunter

Das obige ist der detaillierte Inhalt vonSo laden Sie Kuaishou-Videos in Python herunter. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Welche Bibliotheken sollten für den Python-Crawler installiert werden?Nächster Artikel：Welche Bibliotheken sollten für den Python-Crawler installiert werden?

In Verbindung stehende Artikel

Mehr sehen