首页 >php教程 >php手册 >分享一个PHP采集远程图片

分享一个PHP采集远程图片

WBOY
WBOY原创
2016-05-25 16:49:231677浏览

利用php来采集图片方法很简单本实例使用了fopen来保存文件了,但在此php入门小编建义大家不要使用此方法来获取,如果数据量大量fopen函数性能比curl差得远了,所以大家可尝试改进使用curl来处理。

<?php
/*使用PHP实现采集远程图片功能。基本流程:
1、获取目标网站图片地址。
2、读取图片内容。
3、创建要保存图片的路径并命名图片名称。
4、写入图片内容。
5、完成。
我们通过写几个函数来实现这一过程。*/
//函数make_dir()建立目录。判断要保存的图片文件目录是否存在,如果不存在则创建目录,并且将目录设置为可写权限。
function make_dir($path) {
    if (!file_exists($path)) { //不存在则建立
        $mk = @mkdir($path, 0777); //权限
        @chmod($path, 0777);
    }
    return true;
}
//函数read_filetext()取得图片内容。使用fopen打开图片文件,然后fread读取图片文件内容。
function read_filetext($filepath) {
    $filepath = trim($filepath);
    $htmlfp = @fopen($filepath, "r");
    //远程
    if (strstr($filepath, "://")) {
        while ($data = @fread($htmlfp, 500000)) {
            $string.= $data;
        }
    }
    //本地
    else {
        $string = @fread($htmlfp, @filesize($filepath));
    }
    @fclose($htmlfp);
    return $string;
}
//函数write_filetext()写文件,将图片内容fputs写入文件中,即保存图片文件。
function write_filetext($filepath, $string) {
    //$string=stripSlashes($string);
    $fp = @fopen($filepath, "w");
    @fputs($fp, $string);
    @fclose($fp);
}
//函数get_filename()获取图片名称,也可以自定义要保存的文件名。
function get_filename($filepath) {
    $fr = explode(&ldquo; / ",$filepath); 
$count=count($fr)-1; 
return $fr[$count]; 
}
//然后将几个函数组合,在函数save_pic()中调用,最后返回保存后的图片路径。 
function save_pic($url,$savepath=") {
        //处理地址
        $url = trim($url);
        $url = str_replace(&ldquo;
        "," % 20 & Prime;
        , $url);
        //读文件
        $string = read_filetext($url);
        if (emptyempty($string)) {
            echo &#39;读取不了文件&#39;;
            exit;
        }
        //文件名
        $filename = get_filename($url);
        //存放目录
        make_dir($savepath); //建立存放目录
        //文件地址
        $filepath = $savepath . $filename;
        //写文件
        write_filetext($filepath, $string);
        return $filepath;
    }
    //最后一步就是调用save_pic()函数保存图片,我们使用以下代码做测试。
    //目标图片地址
    //$pic = "/1205/06/2776119_end1_thumb.jpg";
    // for($i=100; $i<=204; $i++)
    // {
    // $pic = &#39;http://cache.soso.com/img/img/e&#39;.$i.&#39;.gif&#39;;
    ////保存目录
    // $savepath = "images/";
    // echo save_pic($pic,$savepath)."<br />";
    // }
    /*
    实际应用中,我们可能会采集某个站点的内容,比如产品信息,包括采集防盗链的图片保存到网站上服务器上。这时我们可以使用正则匹配页面内容,将页面中相匹配的图片都找出来,然后分别下载到网站服务器上,完成图片的采集。以下代码仅供测试:
    */
    function get_pic($cont, $path) {
        $pattern_src = &#39;/<[img|IMG].*?src=[\&#39;|\"](.*?(?:[.gif|.jpg]))[\&#39;|\"].*?[/]?>/&#39;;
        $num = preg_match_all($pattern_src, $cont, $match_src);
        $pic_arr = $match_src[1]; //获得图片数组
        foreach ($pic_arr as $pic_item) { //循环取出每幅图的地址
            save_pic($pic_item, $path); //下载并保存图片
            echo "[OK]..!<br />";
        }
    }
    //然后我们通过分析页面内容,将主体内容找出来,调用get_pic()实现图片的保存。
    //我们采集太平洋电脑网上一篇关于手机报道内容页的图片  php100.com
    $url = "你的网地址";
    $content = file_get_contents($url); //获取网页内容
    $preg = &#39;#<div class="art_con">(.*)<div class="ivy620 ivy620Ex"></div>#iUs&#39;;
    preg_match_all($preg, $content, $arr);
    $cont = $arr[1][0];
    get_pic($cont, &#39;img/&#39;);
    /*
    以上代码笔者亲测,可以采集图片,但是还有些场景没考虑进去,比如目标网站做了302多次跳转的,目标网站做了多种防采集的,留给喜欢折腾的同学去试试吧。
    */
?>


教程网址:

欢迎收藏∩_∩但请保留本文链接。

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn