搜尋
首頁後端開發php教程使用PHP采集远程图片_PHP教程

使用PHP采集远程图片_PHP教程

Jul 20, 2016 am 11:17 AM
php使用內容圖片我們目標網路網頁遠端採集需要

   当我们需要采集网络上的某个网页内容时,如果目标网站上的图片做了防盗链的话,我们直接采集过来的图片在自己网站上是不可用的。那么我们使用程序将目标网站上的图片下载到我们网站服务器上,然后就可调用图片了。

    本文将使用PHP实现采集远程图片功能。基本流程:     1、获取目标网站图片地址。     2、读取图片内容。     3、创建要保存图片的路径并命名图片名称。     4、写入图片内容。     5、完成。     我们通过写几个函数来实现这一过程。     函数make_dir()建立目录。判断要保存的图片文件目录是否存在,如果不存在则创建目录,并且将目录设置为可写权限。     function make_dir($path){     if(!file_exists($path)){//不存在则建立     $mk=@mkdir($path,0777); //权限     @chmod($path,0777);     }     return true;     }     函数read_filetext()取得图片内容。使用fopen打开图片文件,然后fread读取图片文件内容。     function read_filetext($filepath){     $filepath=trim($filepath);     $htmlfp=@fopen($filepath,"r");     //远程     if(strstr($filepath,"://")){     while($data=@fread($htmlfp,500000)){     $string.=$data;     }     }     //本地     else{     $string=@fread($htmlfp,@filesize($filepath));     }     @fclose($htmlfp);     return $string;     }     函数write_filetext()写文件,将图片内容fputs写入文件中,即保存图片文件。     function write_filetext($filepath,$string){     //$string=stripSlashes($string);     $fp=@fopen($filepath,"w");     @fputs($fp,$string);     @fclose($fp);     }     函数get_filename()获取图片名称,也可以自定义要保存的文件名。     function get_filename($filepath){     $fr=explode("/",$filepath);     $count=count($fr)-1;     return $fr[$count];     }     然后将几个函数组合,在函数save_pic()中调用,最后返回保存后的图片路径。     function save_pic($url,$savepath=''){     //处理地址     $url=trim($url);     $url=str_replace(" ","%20",$url);     //读文件     $string=read_filetext($url);     if(empty($string)){     echo '读取不了文件';exit;     }     //文件名     $filename = get_filename($url);     //存放目录     make_dir($savepath); //建立存放目录     //文件地址     $filepath = $savepath.$filename;     //写文件     write_filetext($filepath,$string);     return $filepath;     }     最后一步就是调用save_pic()函数保存图片,我们使用以下代码做测试。     //目标图片地址     $pic = "/program/UploadPic/2013-4/201343155341353.jpg";     //保存目录     $savepath = "images/";     echo save_pic($pic,$savepath);     实际应用中,我们可能会采集某个站点的内容,比如产品信息,包括采集防盗链的图片保存到网站上服务器上。这时我们可以使用正则匹配页面内容,将页面中相匹配的图片都找出来,然后分别下载到网站服务器上,完成图片的采集。以下代码仅供测试:     function get_pic($cont,$path){     $pattern_src = '//';     $num = preg_match_all($pattern_src, $cont, $match_src);     $pic_arr = $match_src[1]; //获得图片数组     foreach ($pic_arr as $pic_item) { //循环取出每幅图的地址     save_pic($pic_item,$path); //下载并保存图片     echo "[OK]..!";     }     }     然后我们通过分析页面内容,将主体内容找出来,调用get_pic()实现图片的保存。     //我们采集太平洋电脑网上一篇关于手机报道内容页的图片 
$url = "http://gz.pconline.com.cn/321/3215791.html"; 
 
$content = file_get_contents($url);//获取网页内容 
$preg = '#<div>(.*)<div></div>#iUs'; 
preg_match_all($preg, $content, $arr); 
$cont = $arr[1][0];  
get_pic($cont,'img/'); 
 
  以上代码笔者亲测,可以采集图片,但是还有些场景没考虑进去,比如目标网站做了302多次跳转的,目标网站做了多种防采集的,留给喜欢折腾的同学去试试吧。
 
<p align="left"></p>
<div style="display:none;">
<span id="url" itemprop="url">http://www.bkjia.com/PHPjc/371938.html</span><span id="indexUrl" itemprop="indexUrl">www.bkjia.com</span><span id="isOriginal" itemprop="isOriginal">true</span><span id="isBasedOnUrl" itemprop="isBasedOnUrl">http://www.bkjia.com/PHPjc/371938.html</span><span id="genre" itemprop="genre">TechArticle</span><span id="description" itemprop="description">当我们需要采集网络上的某个网页内容时,如果目标网站上的图片做了防盗链的话,我们直接采集过来的图片在自己网站上是不可用的。那...</span>
</div>
</div>
<div class="art_confoot"></div>
陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
使用數據庫存儲會話的優點是什麼?使用數據庫存儲會話的優點是什麼?Apr 24, 2025 am 12:16 AM

使用數據庫存儲會話的主要優勢包括持久性、可擴展性和安全性。 1.持久性:即使服務器重啟,會話數據也能保持不變。 2.可擴展性:適用於分佈式系統,確保會話數據在多服務器間同步。 3.安全性:數據庫提供加密存儲,保護敏感信息。

您如何在PHP中實現自定義會話處理?您如何在PHP中實現自定義會話處理?Apr 24, 2025 am 12:16 AM

在PHP中實現自定義會話處理可以通過實現SessionHandlerInterface接口來完成。具體步驟包括:1)創建實現SessionHandlerInterface的類,如CustomSessionHandler;2)重寫接口中的方法(如open,close,read,write,destroy,gc)來定義會話數據的生命週期和存儲方式;3)在PHP腳本中註冊自定義會話處理器並啟動會話。這樣可以將數據存儲在MySQL、Redis等介質中,提升性能、安全性和可擴展性。

什麼是會話ID?什麼是會話ID?Apr 24, 2025 am 12:13 AM

SessionID是網絡應用程序中用來跟踪用戶會話狀態的機制。 1.它是一個隨機生成的字符串,用於在用戶與服務器之間的多次交互中保持用戶的身份信息。 2.服務器生成並通過cookie或URL參數發送給客戶端,幫助在用戶的多次請求中識別和關聯這些請求。 3.生成通常使用隨機算法保證唯一性和不可預測性。 4.在實際開發中,可以使用內存數據庫如Redis來存儲session數據,提升性能和安全性。

您如何在無狀態環境(例如API)中處理會議?您如何在無狀態環境(例如API)中處理會議?Apr 24, 2025 am 12:12 AM

在無狀態環境如API中管理會話可以通過使用JWT或cookies來實現。 1.JWT適合無狀態和可擴展性,但大數據時體積大。 2.Cookies更傳統且易實現,但需謹慎配置以確保安全性。

您如何防止與會議有關的跨站點腳本(XSS)攻擊?您如何防止與會議有關的跨站點腳本(XSS)攻擊?Apr 23, 2025 am 12:16 AM

要保護應用免受與會話相關的XSS攻擊,需採取以下措施:1.設置HttpOnly和Secure標誌保護會話cookie。 2.對所有用戶輸入進行輸出編碼。 3.實施內容安全策略(CSP)限制腳本來源。通過這些策略,可以有效防護會話相關的XSS攻擊,確保用戶數據安全。

您如何優化PHP會話性能?您如何優化PHP會話性能?Apr 23, 2025 am 12:13 AM

优化PHP会话性能的方法包括:1.延迟会话启动,2.使用数据库存储会话,3.压缩会话数据,4.管理会话生命周期,5.实现会话共享。这些策略能显著提升应用在高并发环境下的效率。

什麼是session.gc_maxlifetime配置設置?什麼是session.gc_maxlifetime配置設置?Apr 23, 2025 am 12:10 AM

theSession.gc_maxlifetimesettinginphpdeterminesthelifespanofsessiondata,setInSeconds.1)它'sconfiguredinphp.iniorviaini_set().2)abalanceisesneededeededeedeedeededto toavoidperformance andunununununexpectedLogOgouts.3)

您如何在PHP中配置會話名?您如何在PHP中配置會話名?Apr 23, 2025 am 12:08 AM

在PHP中,可以使用session_name()函數配置會話名稱。具體步驟如下:1.使用session_name()函數設置會話名稱,例如session_name("my_session")。 2.在設置會話名稱後,調用session_start()啟動會話。配置會話名稱可以避免多應用間的會話數據衝突,並增強安全性,但需注意會話名稱的唯一性、安全性、長度和設置時機。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器