우선 Fiddler는 http/https 패킷 캡처 도구이므로 여기서는 소개하지 않겠습니다.
https를 허용하도록 구성
원격 연결을 허용하도록 구성, 즉 http 프록시 열기
컴퓨터 IP: 192.168.1.110
그런 다음 전화와 컴퓨터가 LAN에 있는지 확인하세요. 그리고 의사소통을 할 수 있다. 여기에는 안드로이드 폰이 없기 때문에 대신 안드로이드 에뮬레이터를 사용했는데 효과는 같습니다.
모바일 브라우저를 열고 설정된 프록시 주소인 192.168.1.110:8888을 입력하세요. 인증서를 설치한 후에만 패킷을 캡처할 수 있습니다.
인증서 설치 후 WiFi 설정에서 네트워크를 수정하여 수동으로 지정하세요. http 프록시
저장 그 후 fiddler는 앱 데이터를 캡처할 수 있습니다. Kuaishou를 열어 새로고침하면 많은 http 요청이 들어오는 것을 볼 수 있습니다. 일반 인터페이스 주소는 분명하며, 는 json 유형
입니다. 반환된 데이터는 json입니다. 확장 후 총 20개의 비디오 정보가 있음을 확인합니다. 먼저 올바른지 확인하고 비디오 링크를 찾아보세요.
그런 다음 우편 배달부를 열어 테스트하세요. 양식 데이터 모드로 제출하면 오류가 보고됩니다
원본으로 변경하세요
오류 메시지가 다릅니다
성공. 데이터를 반환하고 여러 번 시도하여 반환된 결과가 매번 다른 것을 확인합니다. 코드를 시작해 보겠습니다# -*-coding:utf-8-*- # author : Corleone import urllib2,urllib import json,os,re,socket,time,sys import Queue import threading import logging # 日志模块 logger = logging.getLogger("AppName") formatter = logging.Formatter('%(asctime)s %(levelname)-5s: %(message)s') console_handler = logging.StreamHandler(sys.stdout) console_handler.formatter = formatter logger.addHandler(console_handler) logger.setLevel(logging.INFO) video_q = Queue.Queue() # 视频队列 def get_video(): url = "http://101.251.217.210/rest/n/feed/hot?app=0&lon=121.372027&c=BOYA_BAIDU_PINZHUAN&sys=ANDROID_4.1.2&mod=HUAWEI(HUAWEI%20C8813Q)&did=ANDROID_e0e0ef947bbbc243&ver=5.4&net=WIFI&country_code=cn&iuid=&appver=5.4.7.5559&max_memory=128&oc=BOYA_BAIDU_PINZHUAN&ftt=&ud=0&language=zh-cn&lat=31.319303 " data = { 'type': 7, 'page': 2, 'coldStart': 'false', 'count': 20, 'pv': 'false', 'id': 5, 'refreshTimes': 4, 'pcursor': 1, 'os': 'android', 'client_key': '3c2cd3f3', 'sig': '22769f2f5c0045381203fc57d1b5ad9b' } req = urllib2.Request(url) req.add_header("User-Agent", "kwai-android") req.add_header("Content-Type", "application/x-www-form-urlencoded") params = urllib.urlencode(data) try: html = urllib2.urlopen(req, params).read() except urllib2.URLError: logger.warning(u"网络不稳定 正在重试访问") html = urllib2.urlopen(req, params).read() result = json.loads(html) reg = re.compile(u"[\u4e00-\u9fa5]+") # 只匹配中文 for x in result['feeds']: try: title = x['caption'].replace("\n","") name = " ".join(reg.findall(title)) video_q.put([name, x['photo_id'], x['main_mv_urls'][0]['url']]) except KeyError: pass def download(video_q): path = u"D:\快手" while True: data = video_q.get() name = data[0].replace("\n","") id = data[1] url = data[2] file = os.path.join(path, name + ".mp4") logger.info(u"正在下载:%s" %name) try: urllib.urlretrieve(url,file) except IOError: file = os.path.join(path, u"神经病呀"+ '%s.mp4') %id try: urllib.urlretrieve(url, file) except (socket.error,urllib.ContentTooShortError): logger.warning(u"请求被断开,休眠2秒") time.sleep(2) urllib.urlretrieve(url, file) logger.info(u"下载完成:%s" % name) video_q.task_done() def main(): # 使用帮助 try: threads = int(sys.argv[1]) except (IndexError, ValueError): print u"\n用法: " + sys.argv[0] + u" [线程数:10] \n" print u"例如:" + sys.argv[0] + " 10" + u" 爬取视频 开启10个线程 每天爬取一次 一次2000个视频左右(空格隔开)" return False # 判断目录 if os.path.exists(u'D:\快手') == False: os.makedirs(u'D:\快手') # 解析网页 logger.info(u"正在爬取网页") for x in range(1,100): logger.info(u"第 %s 次请求" % x) get_video() num = video_q.qsize() logger.info(u"共 %s 视频" %num) # 多线程下载 for y in range(threads): t = threading.Thread(target=download,args=(video_q,)) t.setDaemon(True) t.start() video_q.join() logger.info(u"-----------全部已经爬取完成---------------") main()Test 멀티 스레드 다운로드는 매번 약 2000개의 비디오를 다운로드하며 기본적으로 D: Kuaishou에 다운로드됩니다 관련 권장 사항: "
Python Video Tutorial"
위 내용은 Python으로 Kuaishou 비디오를 다운로드하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!