집 >백엔드 개발 >파이썬 튜토리얼 >Python으로 Kuaishou 비디오를 다운로드하는 방법

Python으로 Kuaishou 비디오를 다운로드하는 방법

尚원래의: 2019-06-24 17:38:315499검색

우선 Fiddler는 http/https 패킷 캡처 도구이므로 여기서는 소개하지 않겠습니다.

https를 허용하도록 구성

Python으로 Kuaishou 비디오를 다운로드하는 방법

원격 연결을 허용하도록 구성, 즉 http 프록시 열기

Python으로 Kuaishou 비디오를 다운로드하는 방법

컴퓨터 IP: 192.168.1.110

그런 다음 전화와 컴퓨터가 LAN에 있는지 확인하세요. 그리고 의사소통을 할 수 있다. 여기에는 안드로이드 폰이 없기 때문에 대신 안드로이드 에뮬레이터를 사용했는데 효과는 같습니다.

모바일 브라우저를 열고 설정된 프록시 주소인 192.168.1.110:8888을 입력하세요. 인증서를 설치한 후에만 패킷을 캡처할 수 있습니다.

Python으로 Kuaishou 비디오를 다운로드하는 방법

인증서 설치 후 WiFi 설정에서 네트워크를 수정하여 수동으로 지정하세요. http 프록시

Python으로 Kuaishou 비디오를 다운로드하는 방법

저장 그 후 fiddler는 앱 데이터를 캡처할 수 있습니다. Kuaishou를 열어 새로고침하면 많은 http 요청이 들어오는 것을 볼 수 있습니다. 일반 인터페이스 주소는 분명하며, 는 json 유형

Python으로 Kuaishou 비디오를 다운로드하는 방법

입니다. 반환된 데이터는 json입니다. 확장 후 총 20개의 비디오 정보가 있음을 확인합니다. 먼저 올바른지 확인하고 비디오 링크를 찾아보세요.

Python으로 Kuaishou 비디오를 다운로드하는 방법

그런 다음 우편 배달부를 열어 테스트하세요. 양식 데이터 모드로 제출하면 오류가 보고됩니다

Python으로 Kuaishou 비디오를 다운로드하는 방법

원본으로 변경하세요

Python으로 Kuaishou 비디오를 다운로드하는 방법

오류 메시지가 다릅니다

Python으로 Kuaishou 비디오를 다운로드하는 방법

성공. 데이터를 반환하고 여러 번 시도하여 반환된 결과가 매번 다른 것을 확인합니다.

코드를 시작해 보겠습니다

# -*-coding:utf-8-*-
# author : Corleone
import urllib2,urllib
import json,os,re,socket,time,sys
import Queue
import threading
import logging
# 日志模块
logger = logging.getLogger("AppName")
formatter = logging.Formatter(&#39;%(asctime)s %(levelname)-5s: %(message)s&#39;)
console_handler = logging.StreamHandler(sys.stdout)
console_handler.formatter = formatter
logger.addHandler(console_handler)
logger.setLevel(logging.INFO)
video_q = Queue.Queue()    # 视频队列
def get_video():
    url = "http://101.251.217.210/rest/n/feed/hot?app=0&lon=121.372027&c=BOYA_BAIDU_PINZHUAN&sys=ANDROID_4.1.2&mod=HUAWEI(HUAWEI%20C8813Q)&did=ANDROID_e0e0ef947bbbc243&ver=5.4&net=WIFI&country_code=cn&iuid=&appver=5.4.7.5559&max_memory=128&oc=BOYA_BAIDU_PINZHUAN&ftt=&ud=0&language=zh-cn&lat=31.319303 "
    data = {
        &#39;type&#39;: 7,
        &#39;page&#39;: 2,
        &#39;coldStart&#39;: &#39;false&#39;,
        &#39;count&#39;: 20,
        &#39;pv&#39;: &#39;false&#39;,
        &#39;id&#39;: 5,
        &#39;refreshTimes&#39;: 4,
        &#39;pcursor&#39;: 1,
        &#39;os&#39;: &#39;android&#39;,
        &#39;client_key&#39;: &#39;3c2cd3f3&#39;,
        &#39;sig&#39;: &#39;22769f2f5c0045381203fc57d1b5ad9b&#39;
    }
    req = urllib2.Request(url)
    req.add_header("User-Agent", "kwai-android")
    req.add_header("Content-Type", "application/x-www-form-urlencoded")
    params = urllib.urlencode(data)
    try:
        html = urllib2.urlopen(req, params).read()
    except urllib2.URLError:
        logger.warning(u"网络不稳定 正在重试访问")
        html = urllib2.urlopen(req, params).read()
    result = json.loads(html)
    reg = re.compile(u"[\u4e00-\u9fa5]+")   # 只匹配中文
    for x in result[&#39;feeds&#39;]:
        try:
            title = x[&#39;caption&#39;].replace("\n","")
            name = " ".join(reg.findall(title))
            video_q.put([name, x[&#39;photo_id&#39;], x[&#39;main_mv_urls&#39;][0][&#39;url&#39;]])
        except KeyError:
            pass
def download(video_q):
    path = u"D:\快手"
    while True:
        data = video_q.get()
        name = data[0].replace("\n","")
        id = data[1]
        url = data[2]
        file = os.path.join(path, name + ".mp4")
        logger.info(u"正在下载：%s" %name)
        try:
            urllib.urlretrieve(url,file)
        except IOError:
            file = os.path.join(path, u"神经病呀"+ &#39;%s.mp4&#39;) %id
            try:
                urllib.urlretrieve(url, file)
            except (socket.error,urllib.ContentTooShortError):
                logger.warning(u"请求被断开，休眠2秒")
                time.sleep(2)
                urllib.urlretrieve(url, file)
        logger.info(u"下载完成：%s" % name)
        video_q.task_done()
def main():
    # 使用帮助
    try:
        threads = int(sys.argv[1])
    except (IndexError, ValueError):
        print u"\n用法: " + sys.argv[0] + u" [线程数:10] \n"
        print u"例如：" + sys.argv[0] + " 10" + u"  爬取视频 开启10个线程 每天爬取一次 一次2000个视频左右(空格隔开)"
        return False
    # 判断目录
    if os.path.exists(u&#39;D:\快手&#39;) == False:
        os.makedirs(u&#39;D:\快手&#39;)
    # 解析网页
    logger.info(u"正在爬取网页")
    for x in range(1,100):
        logger.info(u"第 %s 次请求" % x)
        get_video()
    num = video_q.qsize()
    logger.info(u"共 %s 视频" %num)
    # 多线程下载
    for y in range(threads):
        t = threading.Thread(target=download,args=(video_q,))
        t.setDaemon(True)
        t.start()
    video_q.join()
    logger.info(u"-----------全部已经爬取完成---------------")
main()

Test

Python으로 Kuaishou 비디오를 다운로드하는 방법

멀티 스레드 다운로드는 매번 약 2000개의 비디오를 다운로드하며 기본적으로 D: Kuaishou에 다운로드됩니다

Python으로 Kuaishou 비디오를 다운로드하는 방법

Python으로 Kuaishou 비디오를 다운로드하는 방법

관련 기사