本套《Python實戰爬蟲視頻教程》是一套很給力的python實戰視頻教程,對於已經對Python有一定了解和已經掌握Python的朋友想要再進階一步可以學習本套教程哦!
課程播放網址:http://www.php.cn/course/603.html
該老師講課風格:
教師講課深入淺出,條理清楚,層層剖析,環環相扣,論證嚴密,結構嚴謹,用思維的邏輯力量吸引學生的注意力,用理智控制課堂教學進程。學生透過聽教師的講授,不僅學到知識,也受到思維的訓練,還受到教師嚴謹的治學態度的熏陶和感染
本視頻中較為難點是Python爬蟲了:
在我們日常上網瀏覽網頁的時候,常常會看到一些好看的圖片,我們就希望把這些圖片儲存下載,或是使用者用來做桌面壁紙,或用來做設計的素材。
我們最常規的做法就是透過滑鼠右鍵,選擇另存為。但有些圖片滑鼠右鍵的時候並沒有另存為選項,還有辦法就透過就是透過截圖工具截取下來,但這樣就降低圖片的清晰度。好吧~!其實你很厲害的,右鍵查看頁面原始碼。
我們可以透過python 來實現這樣一個簡單的爬蟲功能,把我們想要的程式碼爬取到本地。下面就來看看如何使用python來實現這樣一個功能。
一,要取得整個頁面資料
首先我們可以先取得要下載圖片的整個頁面資訊。
getjpg.py
#coding=utf-8 import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html html = getHtml("http://tieba.baidu.com/p/2738151262") print html
#Urllib 模組提供了讀取web頁面資料的接口,我們可以像讀取本機檔案一樣讀取www和ftp上的資料。首先,我們定義了一個getHtml()函數:
urllib.urlopen()方法用來開啟一個URL位址。
read()方法用於讀取URL上的數據,向getHtml()函數傳遞一個網址,並把整個頁面下載下來。執行程式就會把整個網頁列印輸出。
以上是Python實戰爬蟲影片教學的資料推薦的詳細內容。更多資訊請關注PHP中文網其他相關文章!