爬取網站上的圖片，並自動下載到本地-php教程-PHP中文網

首頁

後端開發

php教程

爬取網站上的圖片，並自動下載到本地

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 13, 2023 pm 01:28 PM

自動化爬蟲圖片下載

在網路時代，人們已經習慣從圖庫、社群平台等各種網站下載圖片。如果只需要下載少量圖片，手動操作並不繁瑣。但是，如果需要下載大量圖片，手動操作將變得非常費時費力，這時就需要使用自動化技術來實現圖片的自動下載。

本文將介紹如何使用 Python 爬蟲技術，從網站上自動下載圖片到本機。這個過程分為兩步：第一步，使用 Python 的 requests 庫或 selenium 庫抓取網站上的圖片鏈接；第二步，根據獲取到的鏈接，透過 Python 的 urllib 或者 requests 庫將圖片下載到本地。

第一步：取得圖片連結

使用requests 庫爬取連結

先來看看使用requests 庫爬取圖片連結的方法。範例程式碼如下：

import requests
from bs4 import BeautifulSoup

url = 'http://example.com'
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')

img_tags = soup.find_all('img')

urls = [img['src'] for img in img_tags]

這裡以 Example 網站為例，先使用 requests 函式庫爬取網頁內容，並使用 BeautifulSoup 函式庫解析 HTML。然後，我們使用 soup.find_all('img') 方法來取得 HTML 中所有的 img 標籤，並使用清單解析式將每個標籤中的 src 屬性的值提取出來。

使用selenium 庫爬取連結

另一種取得圖片連結的方式是使用selenium 函式庫，範例程式碼如下：

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from time import sleep

url = 'http://example.com'

options = Options()
options.add_argument('--headless')

service = Service('/path/to/chromedriver')
driver = webdriver.Chrome(service=service, options=options)
driver.get(url)

sleep(2)

img_tags = driver.find_elements_by_tag_name('img')

urls = [img.get_attribute('src') for img in img_tags]

這裡我們使用了ChromeDriver，使用時需要先將自己電腦上的ChromeDriver 的路徑填入到範例程式碼中的'path/to/chromedriver' 處。第二行程式碼啟用無頭瀏覽器，避免在 Chrome 瀏覽器視窗中進行操作，提高運行速度。然後我們使用 selenium 庫中的 webdriver 模組建立了一個 Chrome 瀏覽器的實例，透過設定 driver.get(url) 來開啟 Example 網站。然後使用 driver.find_elements_by_tag_name('img') 取得到所有的 img 標籤，進而取得每個標籤中的 src 屬性的值。

第二步：下載圖片

下載圖片的方式有很多種，這裡我們使用 Python 內建的 urllib 函式庫或 requests 函式庫來下載。範例程式碼如下：

import urllib.request

for url in urls:
    filename = url.split('/')[-1]
    urllib.request.urlretrieve(url, filename)

這裡使用urllib.request 函式庫將圖片從網路上下載到本機，使用url.split('/')[-1] 來取得圖片的文件名，並將其賦值給變數filename，最後使用urllib.request.urlretrieve(url, filename) 將圖片下載到本機。要注意的是，如果 url 中包含中文，還需要對 url 進行程式設計處理。

這裡再簡單介紹一下使用 requests 庫下載圖片的方法，範例程式碼如下：

import requests

for url in urls:
    filename = url.split('/')[-1]
    response = requests.get(url)
    with open(filename, 'wb') as f:
        f.write(response.content)

這裡使用 requests 函式庫取得圖片二進位文件，將其寫入檔案。需要注意的是，由於二進位檔案寫入模式為'wb'，需要使用with open(filename, 'wb') as f: 的方式來開啟檔案並寫入，確保每個文件都正確關閉。

總結

綜上所述，透過 Python 爬蟲技術，我們能夠非常輕鬆地爬取網站上的圖片，並將其自動下載到本機。這種自動化技術能夠幫助我們提高工作效率，對於需要處理大量圖片的工作非常有幫助。同時，需要提醒的是，爬取網站上的圖片需要遵守相關法規，並尊重網站的版權。如果沒有得到網站官方的授權或許可，不要未經允許擅自爬取網站上的圖片。

以上是爬取網站上的圖片，並自動下載到本地的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

PHP：服務器端腳本語言的簡介Apr 16, 2025 am 12:18 AM

PHP是一種服務器端腳本語言，用於動態網頁開發和服務器端應用程序。 1.PHP是一種解釋型語言，無需編譯，適合快速開發。 2.PHP代碼嵌入HTML中，易於網頁開發。 3.PHP處理服務器端邏輯，生成HTML輸出，支持用戶交互和數據處理。 4.PHP可與數據庫交互，處理表單提交，執行服務器端任務。

PHP和網絡：探索其長期影響Apr 16, 2025 am 12:17 AM

PHP在過去幾十年中塑造了網絡，並將繼續在Web開發中扮演重要角色。 1)PHP起源於1994年，因其易用性和與MySQL的無縫集成成為開發者首選。 2)其核心功能包括生成動態內容和與數據庫的集成，使得網站能夠實時更新和個性化展示。 3)PHP的廣泛應用和生態系統推動了其長期影響，但也面臨版本更新和安全性挑戰。 4)近年來的性能改進，如PHP7的發布，使其能與現代語言競爭。 5)未來，PHP需應對容器化、微服務等新挑戰，但其靈活性和活躍社區使其具備適應能力。

為什麼要使用PHP？解釋的優點和好處Apr 16, 2025 am 12:16 AM

PHP的核心優勢包括易於學習、強大的web開發支持、豐富的庫和框架、高性能和可擴展性、跨平台兼容性以及成本效益高。 1)易於學習和使用，適合初學者；2)與web服務器集成好，支持多種數據庫；3)擁有如Laravel等強大框架；4)通過優化可實現高性能；5)支持多種操作系統；6)開源，降低開發成本。

揭穿神話：PHP真的是一種死語嗎？Apr 16, 2025 am 12:15 AM

PHP沒有死。 1)PHP社區積極解決性能和安全問題，PHP7.x提升了性能。 2)PHP適合現代Web開發，廣泛用於大型網站。 3)PHP易學且服務器表現出色，但類型系統不如靜態語言嚴格。 4)PHP在內容管理和電商領域仍重要，生態系統不斷進化。 5)通過OPcache和APC等優化性能，使用OOP和設計模式提升代碼質量。

PHP與Python辯論：哪個更好？Apr 16, 2025 am 12:03 AM

PHP和Python各有優劣，選擇取決於項目需求。 1)PHP適合Web開發，易學，社區資源豐富，但語法不夠現代，性能和安全性需注意。 2)Python適用於數據科學和機器學習，語法簡潔，易學，但執行速度和內存管理有瓶頸。

PHP的目的：構建動態網站Apr 15, 2025 am 12:18 AM

PHP用於構建動態網站，其核心功能包括：1.生成動態內容，通過與數據庫對接實時生成網頁；2.處理用戶交互和表單提交，驗證輸入並響應操作；3.管理會話和用戶認證，提供個性化體驗；4.優化性能和遵循最佳實踐，提升網站效率和安全性。

PHP：處理數據庫和服務器端邏輯Apr 15, 2025 am 12:15 AM

PHP在數據庫操作和服務器端邏輯處理中使用MySQLi和PDO擴展進行數據庫交互，並通過會話管理等功能處理服務器端邏輯。 1）使用MySQLi或PDO連接數據庫，執行SQL查詢。 2）通過會話管理等功能處理HTTP請求和用戶狀態。 3）使用事務確保數據庫操作的原子性。 4）防止SQL注入，使用異常處理和關閉連接來調試。 5）通過索引和緩存優化性能，編寫可讀性高的代碼並進行錯誤處理。