Pythonを使用したYouku動画一括ダウンロード機能の実装例-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

Pythonを使用したYouku動画一括ダウンロード機能の実装例

高洛峰

Mar 16, 2017 am 09:21 AM

前段时间由于收集视频数据的需要，自己捣鼓了一个YouKu视频批量下载的程序。东西虽然简单，但还挺实用的，拿出来分享给大家。

　　版本：Python2.7+BeautifulSoup3.2.1

import urllib,urllib2,sys,os
from BeautifulSoup import BeautifulSoup
import itertools,re
url_i =1
pic_num = 1
#自己定义的引号格式转换函数
def _en_to_cn(str):
  obj = itertools.cycle([&#39;“&#39;,&#39;”&#39;])
  _obj = lambda x: obj.next()
  return re.sub(r"[&#39;\"]",_obj,str)
if name == &#39;main&#39;:
  #下载连续3个网页的视频
  while url_i <= 3:
    webContent = urllib2.urlopen("http://news.youku.com/focus/index/_page26716_" + str(url_i) + ".html")
    data = webContent.read()
    #利用BeautifulSoup读取视频列表网页数据
    soup = BeautifulSoup(data)
    print "-------------------------Page " + str(url_i) + "-------------------------"
    #获得相应页面的视频thumbnail和title的list
    tag_list_thumb = soup.findAll(&#39;li&#39;,&#39;v_thumb&#39;)
    tag_list = soup.findAll(&#39;li&#39;, "v_title")
    for item in tag_list:
      #通过每个thumbnail中的herf导向视频播放页面
      web_video_play = urllib2.urlopen(item.a[&#39;href&#39;])
      data_vp = web_video_play.read()
      #利用BeautifulSoup读取视频播放网页数据
      soup_vp = BeautifulSoup(data_vp)
      #找到“下载”对应的链接
      tag_vp_list = soup_vp.findAll(&#39;a&#39;, id = &#39;fn_download&#39;)
      for item_vp in tag_vp_list:
        #将下载链接保存到url_dw中
        url_dw = &#39;"&#39; + item_vp[&#39;_href&#39;] + &#39;"&#39;
        print item.a[&#39;title&#39;] + ": " + url_dw
        #调用命令行运行iku下载视频，需将iku加入环境变量
        os.system("iku " + url_dw)
    #保存每个视频的thumbnail
    for item_thumb in tag_list_thumb:
      urllib.urlretrieve(item_thumb.img[&#39;src&#39;], "E:\\下载视频\\thumbnails\\" + str(pic_num) + "." +
                _en_to_cn(item_thumb.img[&#39;title&#39;]) + ".jpg")
      pic_num += 1
    print "--------------------------------------------------------------"
    print "--------Page " + str(url_i) + "&#39;s video thumbnails have been saved!"
    url_i += 1

　　程序思想很简单，就是通过解析网页数据找到相应的视频播放网页链接，然后根据播放页面找到下载的链接，如下图所示：

Pythonを使用したYouku動画一括ダウンロード機能の実装例

　　由于从网页数据中获得的下载链接是必须通过youku自己的iku才能下载的。这一点费了我一番周折，侥幸发现iku这个软件的命令行非常简单（直接iku download_link即可），所以最简单的办法就是利用Python中的命令行接口os.system来调用iku来下载视频。另外注意程序运行之前需要先启动iku，否则下载完一个视频就要再启动一次。

PS：下载视频的时候就会发现，国内这些视频网页做的真的不够精细，含有太多的重复链接和坏死链接，小小鄙视一下。

以上がPythonを使用したYouku動画一括ダウンロード機能の実装例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Python：ゲーム、GUIなどApr 13, 2025 am 12:14 AM

PythonはゲームとGUI開発に優れています。 1）ゲーム開発は、2Dゲームの作成に適した図面、オーディオ、その他の機能を提供し、Pygameを使用します。 2）GUI開発は、TKINTERまたはPYQTを選択できます。 TKINTERはシンプルで使いやすく、PYQTは豊富な機能を備えており、専門能力開発に適しています。

Python vs. C：比較されたアプリケーションとユースケースApr 12, 2025 am 12:01 AM

Pythonは、データサイエンス、Web開発、自動化タスクに適していますが、Cはシステムプログラミング、ゲーム開発、組み込みシステムに適しています。 Pythonは、そのシンプルさと強力なエコシステムで知られていますが、Cは高性能および基礎となる制御機能で知られています。

2時間のPython計画：現実的なアプローチApr 11, 2025 am 12:04 AM

2時間以内にPythonの基本的なプログラミングの概念とスキルを学ぶことができます。 1.変数とデータ型、2。マスターコントロールフロー（条件付きステートメントとループ）、3。機能の定義と使用を理解する4。

Python：主要なアプリケーションの調査Apr 10, 2025 am 09:41 AM

Pythonは、Web開発、データサイエンス、機械学習、自動化、スクリプトの分野で広く使用されています。 1）Web開発では、DjangoおよびFlask Frameworksが開発プロセスを簡素化します。 2）データサイエンスと機械学習の分野では、Numpy、Pandas、Scikit-Learn、Tensorflowライブラリが強力なサポートを提供します。 3）自動化とスクリプトの観点から、Pythonは自動テストやシステム管理などのタスクに適しています。