ホームページ >バックエンド開発 >Python チュートリアル >Python ビデオクローラーはヘッドラインビデオのダウンロードを実装します

Python ビデオクローラーはヘッドラインビデオのダウンロードを実装します

不言オリジナル: 2018-05-07 13:49:152181ブラウズ

この記事では主に、Python の定期的なマッチング、ネットワーク送信、ファイルの読み取りと書き込み、およびその他の関連操作スキルを含む、見出しビデオをダウンロードする機能を実装する Python ビデオクローラーを紹介します。この記事では、その例について説明します。 Python ビデオクローラーのヘッドラインビデオ機能のダウンロードを実装します。参考までに皆さんと共有してください。詳細は次のとおりです:

1. 需要分析

見出しの短いビデオをキャプチャします

アイデア:

Web ページのソースコードを分析し、ビデオリソースを検索して解析しますURL (ソースコードの表示、mp4 の検索)

URL へのリクエストを開始し、バイナリデータを返します

バイナリデータをビデオ形式で保存します

ビデオリンク:

http://video.eastday.com/a/170612170956054127565 .html

2. コードの実装

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding(&#39;utf-8&#39;)
import requests
import re
import time
time1=time.time()
main_url = &#39;http://video.eastday.com/a/170612170956054127565.html&#39;
resp = requests.get(main_url)
#没有这行，打印的结果中文是乱码
resp.encoding = &#39;utf-8&#39;
html = resp.text
link = re.findall(r&#39;var mp4 = "(.*?)";&#39;, html)[0]
link = &#39;http:&#39;+link
dest_resp = requests.get(link)
#视频是二进制数据流，content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u&#39;C:/赵丽颖.mp4&#39;
f = open(path, &#39;wb&#39;)
f.write(data)
f.close()
time2 = time.time()
print u&#39;ok,下载完成!&#39;
print u&#39;总共耗时：&#39; + str(time2 - time1) + &#39;s

"D:Program FilesPython27python.exe" D:/PycharmProjects/learn2017/testwechat.py

、ダウンロードは完了しました!
合計所要時間: 0499992371s
終了コード0でプロセスが終了しました

ダウンロードに成功し、再生できます~

Python ビデオ クローラーはヘッドライン ビデオのダウンロードを実装します

関連記事

Python ビデオクローラーはヘッドラインビデオのダウンロードを実装します