首頁 >後端開發 >php教程 >爬蟲實戰：PHP 抓取天氣數據

爬蟲實戰：PHP 抓取天氣數據

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB原創: 2023-06-13 08:11:131222瀏覽

在現代社會，天氣資訊對人們來說已經成為了生活中不可或缺的一部分。無論是旅遊計畫、旅遊安排或今日服裝搭配，都需要依賴準確的天氣預報。然而，天氣預報的數據又是如何取得的呢？其實這些天氣預報的資料都是由一些專門的天氣資料網站提供的，透過網路爬蟲可以輕鬆的實現對這些天氣資料的抓取。本文將以取得某城市的天氣預報資料為例，介紹如何使用 PHP編寫爬蟲來實現天氣資料的抓取。

一、分析目標網站

在進行網路爬蟲之前，首先需要分析目標網站的原始碼結構，並了解所需取得的資訊在原始碼中的位置。這裡以「中國天氣網」（http://www.weather.com.cn/）為例，網站提供了各城市的天氣預報，我們要抓取的就是某個城市的天氣預報資訊。

開啟瀏覽器並造訪該網站，輸入目標城市的名稱，例如 “北京”，並點擊查詢。此時會出現這個城市今天和未來7天的天氣預報狀況，我們要抓取的就是這些資訊。使用瀏覽器的開發者工具分析網頁原始碼，可以看到這些天氣預報資訊都包含在一個 id 為 “7d”的 div 標籤內。

二、爬蟲程式的編寫

分析完目標網站的原始碼結構之後，我們就可以著手寫爬蟲程式了。首先需要定義一些常數和變數來儲存一些配置訊息，例如目標城市，目標天氣資料的URL等等。

// 目标城市名称
$city_name = '北京';

// 目标城市天气数据URL
$url = 'http://www.weather.com.cn/weather/101010100.shtml';

接下來就是爬蟲的核心邏輯。首先需要使用 CURL 庫進行 HTTP 請求並獲取目標城市的天氣預報頁面，然後解析 HTML 頁面獲取所需的數據，最後將數據保存到文件中等待後續的處理。

// 初始化 CURL，获取天气预报页面
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 0);
$page_content = curl_exec($ch);

// 解析天气预报页面，获取需要的信息
$doc = new DOMDocument();
$doc->loadHTML($page_content);
$xpath = new DOMXPath($doc);

// 获取未来 7 天天气预报信息
$days = $xpath->query('//div[@id="7d"]//div[@class="con"]/ul/li');

// 遍历天气预报信息，保存到文件中
$file = fopen('weather.txt', 'a+');
foreach($days as $day) {
    $date = trim($day->getElementsByTagName('h1')->item(0)->nodeValue);
    $conditions = $day->getElementsByTagName('p')->item(0)->nodeValue;
    $min_temperature = $day->getElementsByTagName('span')->item(0)->nodeValue;
    $max_temperature = $day->getElementsByTagName('span')->item(1)->nodeValue;
    $line = sprintf("%s%s    %s    %s
", $city_name, $date, $min_temperature, $max_temperature);
    fwrite($file, $line);
}
fclose($file);

// 关闭 CURL
curl_close($ch);

三、執行爬蟲程式

完成爬蟲程式的編寫之後，就可以執行程式並取得天氣資料了。在終端機中切換到程式所在目錄，並輸入以下命令運行程式。

php weather_spider.php

程式運行過程可能需要一定時間等待，取決於目標城市天氣資料頁面的載入速度。但是透過觀察控制台輸出，我們可以看到程式已經運行成功，並將天氣預報資訊儲存到了檔案中。

四、總結

透過本篇文章的介紹，我們了解如何使用 PHP 編寫一個網路爬蟲程序，取得目標網站的資料。網路爬蟲雖然有著強大的資料取得能力，但也需要注意一些倫理和法律問題，例如不能對他人網站進行惡意攻擊、侵犯他人資料隱私等等。希望大家在使用網路爬蟲時，能遵守相關法令和道德標準，合理運用網路爬蟲技術。

以上是爬蟲實戰：PHP 抓取天氣數據的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述：

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

上一篇：PHP程式設計中有哪些常見的SonarQube操作？下一篇：PHP程式設計中有哪些常見的SonarQube操作？

看更多