搜尋
首頁後端開發php教程與Symfony的圖像刮擦

與Symfony的圖像刮擦

>我的攝影師朋友懇請我從Internet查找和下載圖像的圖像。最終,我降落在一個免費的網頁上,其中有很多免費,但存在一個問題:並不存在將所有圖像一起下載的鏈接。

>我不想經歷單獨下載圖像的壓力,所以我寫了此PHP課程以查找,下載和zip在網站上找到的所有圖像。

>

鑰匙要點

  • > PHP類利用Symfony的Domcrawler組件從網頁上刮擦圖像,下載並將其保存到文件夾中,創建文件夾的ZIP檔案,然後刪除文件夾。該課程旨在自動化從網站下載多個圖像的過程。
  • >
  • 課程包括五個私人屬性和八種公共方法。屬性存儲信息,例如文件夾名稱,網頁URL,HTML文檔代碼,ZIP文件名和操作狀態。這些方法包括設置文件夾和文件名,實例化domcrawler,下載和保存圖像,創建zip文件,刪除文件夾並獲取操作狀態的函數。 >
  • 要使用類,必須通過自動加載或明確包含所有必需的文件。 SetFolder和setFilename方法應使用其各自的參數調用,然後調用過程方法使該類工作。必須包括domcrawler組件和create_zip函數以使類功能。
  • 班級的工作方式

>它搜索圖像,下載並將圖像保存到文件夾中,創建文件夾的zip檔案,最後刪除文件夾。

>

>類使用Symfony的Domcrawler組件來搜索網頁上找到的所有圖像鏈接以及創建zip文件的自定義zip函數。借助David Walsh的ZIP功能。

編碼類

>該類包括五個私人屬性和八種公共方法,包括__ -Construct Magic方法。

下面的與Symfony的圖像刮擦是類屬性及其角色的列表。

1。 $文件夾:存儲包含刮擦圖像的文件夾的名稱。

2。 $ URL:存儲網頁URL。
3。 $ html:存儲要刮擦的網頁的HTML文檔代碼。
4。 $文件名:存儲zip文件的名稱。
5。 $狀態:保存操作的狀態。即,如果是成功或失敗。
>
>讓我們開始建立課程。

創建包含上述五個屬性的類Zipimages。

創建一個接受URL作為參數的__ -construct魔法方法。
<span><span><?php </span></span><span><span>class ZipImages {
</span></span><span>    <span>private $folder;
</span></span><span>    <span>private $url;
</span></span><span>    <span>private $html;
</span></span><span>    <span>private $fileName;
</span></span><span>    <span>private $status;</span></span></span>
該方法是不言自明的。


創建的郵政編碼具有一個包含刮擦圖像的文件夾。下面的setFolder方法配置了以下內容。
<span>public function __construct($url) {
</span>    <span>$this->url = $url; 
</span>    <span>$this->html = file_get_contents($this->url);
</span>    <span>$this->setFolder();
</span><span>}</span>

默認情況下,文件夾名稱設置為圖像,但是該方法提供了一個選項,可以通過簡單地將文件夾名稱作為其參數來更改文件夾的名稱。

<span><span><?php </span></span><span><span>class ZipImages {
</span></span><span>    <span>private $folder;
</span></span><span>    <span>private $url;
</span></span><span>    <span>private $html;
</span></span><span>    <span>private $fileName;
</span></span><span>    <span>private $status;</span></span></span>

> setFileName提供了一個選項,可以將eftault名稱設置為zipimages更改zip文件的名稱:

<span>public function __construct($url) {
</span>    <span>$this->url = $url; 
</span>    <span>$this->html = file_get_contents($this->url);
</span>    <span>$this->setFolder();
</span><span>}</span>
在這一點上,我們實例化Symfony crawler組件以搜索圖像,然後下載並將所有圖像保存到文件夾中。

<span>public function setFolder($folder="image") {
</span>    <span>// if folder doesn't exist, attempt to create one and store the folder name in property $folder
</span>    <span>if(!file_exists($folder)) {
</span>        <span>mkdir($folder);
</span>    <span>}
</span>    <span>$this->folder = $folder;
</span><span>}</span>
完成下載後,我們使用我們的自定義create_zip函數將圖像文件夾壓縮到zip存檔。

最後,我們在創建zip文件後刪除創建的文件夾。
<span>public function setFileName($name = "zipImages") {
</span>    <span>$this->fileName = $name;
</span><span>}</span>

獲得操作的狀態。即,如果成功或發生錯誤。

>
<span>public function domCrawler() {
</span>    <span>//instantiate the symfony DomCrawler Component
</span>    <span>$crawler = new Crawler($this->html);
</span>    <span>// create an array of all scrapped image links
</span>    <span>$result = $crawler
</span>        <span>->filterXpath('//img')
</span>        <span>->extract(array('src'));
</span>
<span>// download and save the image to the folder 
</span>    <span>foreach ($result as $image) {
</span>        <span>$path = $this->folder."/".basename($image);
</span>        <span>$file = file_get_contents($image);
</span>        <span>$insert = file_put_contents($path, $file);
</span>        <span>if (!$insert) {
</span>            <span>throw new <span>\Exception</span>('Failed to write image');
</span>        <span>}
</span>    <span>}
</span><span>}</span>

處理上述所有方法。

<span>public function createZip() {
</span>    <span>$folderFiles = scandir($this->folder);
</span>    <span>if (!$folderFiles) {
</span>        <span>throw new <span>\Exception</span>('Failed to scan folder');
</span>    <span>}
</span>    <span>$fileArray = array();
</span>    <span>foreach($folderFiles as $file){
</span>        <span>if (($file != ".") && ($file != "..")) {
</span>            <span>$fileArray[] = $this->folder."/".$file;
</span>        <span>}
</span>    <span>}
</span>
    <span>if (create_zip($fileArray, $this->fileName.'.zip')) {
</span>        <span>$this->status = <span><span>
</span></span><span>File successfully archived. <a href="<span%20><span%20>%24this->fileName</span>.zip">Download it now</a>
</span></span><span><span>HTML<span>;</span></span>
</span>    <span>} else {
</span>        <span>$this->status = "An error occurred";
</span>    <span>}
</span><span>}</span>

您可以從GitHub下載完整的課程。

<span>public function deleteCreatedFolder() {
</span>    <span>$dp = opendir($this->folder) or die ('ERROR: Cannot open directory');
</span>    <span>while ($file = readdir($dp)) {
</span>        <span>if ($file != '.' && $file != '..') {
</span>            <span>if (is_file("<span><span>$this->folder</span>/<span>$file</span>"</span>)) {
</span>                <span>unlink("<span><span>$this->folder</span>/<span>$file</span>"</span>);
</span>            <span>}
</span>        <span>}
</span>    <span>}
</span>    <span>rmdir($this->folder) or die ('could not delete folder');
</span><span>}</span>
class依賴

為了使課程工作,需要包括domcrawler組件和create_zip函數。您可以在此處下載此功能的代碼。

>僅通過將以下要求語句添加到您的Composer.json文件:>通過作曲家下載並安裝Domcrawler組件。

>運行$ php composer.phar安裝以下載庫並生成供應商/autoLoad.php autoLoader文件。

>

使用類
<span>public function getStatus() {
</span>    <span>echo $this->status;
</span><span>}</span>

確保通過自動加載或明確包含所有必需的文件。

>

>調用setFolder和setFilename方法,並通過其各自的參數。僅在需要更改文件夾名稱時調用setFolder方法。
    >
  • 調用過程方法以使課程上班。
<span>public function process() {
</span>    <span>$this->domCrawler();
</span>    <span>$this->createZip();
</span>    <span>$this->deleteCreatedFolder();
</span>    <span>$this->getStatus();
</span><span>}</span>
摘要

在本文中,我們學會瞭如何創建一個簡單的PHP圖像刮刀,該剪貼畫將自動將下載的圖像壓縮到ZIP檔案中。如果您有其他解決方案或改進建議,請將其留在下面的評論中,歡迎所有反饋! 與Symfony的圖像刮擦

經常詢問有關與Symfony的Domcrawler

刮擦圖像的問題(常見問題解答)

Symfony的Domcrawler組件是什麼? >>如何安裝Symfony的Domcrawler組件?

安裝Symfony的Domcrawler組件是直截了當。您可以使用PHP的依賴關係管理工具Composer。在項目目錄中運行以下命令:作曲家需要Symfony/Dom-Crawler。這將下載並安裝domcrawler組件及其依賴項。

>

>如何使用Symfony的Domcrawler組件來刮擦圖像?

>使用Symfony的Domcrawler組件刮擦圖像,您首先需要創建一個新的crawler類的實例,然後將HTML內容加載到其中。然後,您可以使用過濾器方法選擇圖像元素並提取其SRC屬性。這是一個基本示例:

$ crawler = new Crawler($ html);
> $ crawler-> filter-> filter('img') - > every(function(crawler $ node) node -> attr('src');
});

>我可以將Symfony的Domcrawler組件與是的,您可以將Symfony的Domcrawler組件與Laravel一起使用。 Laravel的HTTP測試功能實際上使用了引擎蓋下的Domcrawler組件。這意味著您可以使用相同的方法和技術在Laravel測試中遍歷和操縱HTML內容。

>

>如何使用Symfony's Domcrawler組件選擇元素?選擇元素,包括過濾器,FilterXpath和SelectLink。這些方法允許您分別基於其標籤名稱,XPATH表達式或鏈接文本選擇元素。

我可以使用Symfony的Domcrawler組件修改元素的內容嗎?使用Symfony的DomCrawler組件修改元素的內容。每種方法都允許您迭代每個選定的元素並在其上執行操作。例如,您可以更改類似圖像元素的src屬性:

$ crawler-> filter-> filter('img') - > every(function(crawler $ node){

$ node-> attr ('src','new-image.jpg');

});

在使用Symfony's時如何處理錯誤和異常Domcrawler組件?


使用Symfony的Domcrawler組件時,可以使用Try-Catch塊來處理錯誤和異常。例如,如果過濾器方法找不到任何匹配元素,它將拋出無效的exception。您可以捕獲此異常並適當處理。

我可以使用Symfony的Domcrawler組件來刮擦需要身份驗證的網站嗎?但是,這需要其他步驟,例如以登錄憑據發送發布請求並存儲會話cookie。使用Symfony的Domcrawler組件提供的ATTAD方法的值。例如,要提取圖像元素的SRC屬性,您可以執行以下操作:

$ crawler-> filter('img') - > every(function(crawler $ node) $ node-> attr('src ');

});

>不幸的是,我可以使用Symfony的Domcrawler組件來刮擦Ajax負載的內容嗎?

不幸的是,Symfony的Domcrawler組件無法直接刮擦Ajax ajax的內容,因為它沒有執行JavaScript。但是,您可以將Guzzle和Goutte之類的工具與Domcrawler組件結合使用來發送HTTP請求並處理AJAX負載的內容。

以上是與Symfony的圖像刮擦的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
unset()和session_destroy()有什麼區別?unset()和session_destroy()有什麼區別?May 04, 2025 am 12:19 AM

Thedifferencebetweenunset()andsession_destroy()isthatunset()clearsspecificsessionvariableswhilekeepingthesessionactive,whereassession_destroy()terminatestheentiresession.1)Useunset()toremovespecificsessionvariableswithoutaffectingthesession'soveralls

在負載平衡的情況下,什麼是粘性會話(會話親和力)?在負載平衡的情況下,什麼是粘性會話(會話親和力)?May 04, 2025 am 12:16 AM

stickysessensureuserRequestSarerOutedTothesMeServerForsessionDataConsisterency.1)sessionIdentificeAssificationAssigeaSsignAssignSignSuserServerServerSustersusiseCookiesorUrlModifications.2)一致的ententRoutingDirectSsssssubsequeSssubsequeSubsequestrequestSameSameserver.3)loadBellankingDisteributesNebutesneNewuserEreNevuseRe.3)

PHP中有哪些不同的會話保存處理程序?PHP中有哪些不同的會話保存處理程序?May 04, 2025 am 12:14 AM

phpoffersvarioussessionsionsavehandlers:1)文件:默認,簡單的ButMayBottLeneckonHigh-trafficsites.2)Memcached:高性能,Idealforsforspeed-Criticalapplications.3)REDIS:redis:similartomemememememcached,withddeddeddedpassistence.4)withddeddedpassistence.4)databases:gelifforcontrati forforcontrati,有用

PHP中的會話是什麼?為什麼使用它們?PHP中的會話是什麼?為什麼使用它們?May 04, 2025 am 12:12 AM

PHP中的session是用於在服務器端保存用戶數據以在多個請求之間保持狀態的機制。具體來說,1)session通過session_start()函數啟動,並通過$_SESSION超級全局數組存儲和讀取數據;2)session數據默認存儲在服務器的臨時文件中,但可通過數據庫或內存存儲優化;3)使用session可以實現用戶登錄狀態跟踪和購物車管理等功能;4)需要注意session的安全傳輸和性能優化,以確保應用的安全性和效率。

說明PHP會話的生命週期。說明PHP會話的生命週期。May 04, 2025 am 12:04 AM

PHPsessionsstartwithsession_start(),whichgeneratesauniqueIDandcreatesaserverfile;theypersistacrossrequestsandcanbemanuallyendedwithsession_destroy().1)Sessionsbeginwhensession_start()iscalled,creatingauniqueIDandserverfile.2)Theycontinueasdataisloade

絕對會話超時有什麼區別?絕對會話超時有什麼區別?May 03, 2025 am 12:21 AM

絕對會話超時從會話創建時開始計時,閒置會話超時則從用戶無操作時開始計時。絕對會話超時適用於需要嚴格控制會話生命週期的場景,如金融應用;閒置會話超時適合希望用戶長時間保持會話活躍的應用,如社交媒體。

如果會話在服務器上不起作用,您將採取什麼步驟?如果會話在服務器上不起作用,您將採取什麼步驟?May 03, 2025 am 12:19 AM

服務器會話失效可以通過以下步驟解決:1.檢查服務器配置,確保會話設置正確。 2.驗證客戶端cookies,確認瀏覽器支持並正確發送。 3.檢查會話存儲服務,如Redis,確保其正常運行。 4.審查應用代碼,確保會話邏輯正確。通過這些步驟,可以有效診斷和修復會話問題,提升用戶體驗。

session_start()函數的意義是什麼?session_start()函數的意義是什麼?May 03, 2025 am 12:18 AM

session_start()iscucialinphpformanagingusersessions.1)ItInitiateSanewsessionifnoneexists,2)resumesanexistingsessions,and3)setsasesessionCookieforContinuityActinuityAccontinuityAcconActInityAcconActInityAcconAccRequests,EnablingApplicationsApplicationsLikeUseAppericationLikeUseAthenticationalticationaltication and PersersonalizedContentent。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器