この「Python 実践的なクローラー ビデオ チュートリアル」セットは、すでに Python をある程度理解し、Python をマスターし、さらに一歩進めたいと考えている友人が、この一連のチュートリアルを学ぶことができる、非常に強力な Python 実践的なビデオ チュートリアルです。
コース再生アドレス: http://www.php.cn/course/603.html
先生の教え方:
先生の講義はシンプルで奥深く、わかりやすいです論理的思考力を使用して生徒の注意を引き、理性を使用して教室での指導プロセスを制御することで、層ごとに連動し、厳密な議論と厳密な構造を組織化して分析します。先生の講義を聞くことで、学生は知識を学ぶだけでなく、思考力のトレーニングも受け、先生の厳格な学習態度に影響され、影響を受けます
このビデオでより難しい部分は、Python クローラーです:
毎日インターネットを閲覧していると、素敵な写真を目にすることが多く、その写真を保存してダウンロードしたり、デスクトップの壁紙やデザイン素材として使用したくなります。
最も一般的な方法は、マウスを右クリックして [名前を付けて保存] を選択することです。ただし、一部の画像には、マウスを右クリックしたときに「名前を付けて保存」オプションがありません。スクリーンショット ツールを使用してキャプチャすることもできますが、これにより画像の鮮明さが低下します。よし〜!実際、右クリックしてページのソース コードを表示するのは非常に便利です。
Pythonを使用してこのような単純なクローラー機能を実装し、必要なコードをローカルでクロールできます。 Python を使用してこのような機能を実装する方法を見てみましょう。
まず、ページ全体のデータを取得します
まず、ダウンロードする画像のページ全体の情報を取得します。
getjpg.py
#coding=utf-8 import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html html = getHtml("http://tieba.baidu.com/p/2738151262") print html
Urllib モジュールは、Web ページのデータを読み取るためのインターフェースを提供します。www および ftp 上のデータをローカル ファイルと同様に読み取ることができます。まず、getHtml() 関数を定義します。
urllib.urlopen() メソッドは、URL アドレスを開くために使用されます。
read()メソッドは、URL上のデータを読み取り、getHtml()関数にURLを渡し、ページ全体をダウンロードするために使用されます。プログラムを実行すると、Web ページ全体が印刷されます。
以上がPython実践クローラー動画チュートリアルのおすすめ教材の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。