Home >php教程 >php手册 >PHP把文章中的远程图片采集到本地

PHP把文章中的远程图片采集到本地

WBOY
WBOYOriginal
2016-06-13 10:36:54816browse

今天写了一个这个功能, 拿出来跟php100的朋友一起分享

第一步. 先从文章中把所有PHP把文章中的远程图片采集到本地 用正则 抠出来.

    $message   //文章内容
    //正则(这个还不是)
    $reg = "/PHP把文章中的远程图片采集到本地]*src="(http://(.+)/(.+).(jpg|gif|bmp|bnp))"/isU";
    //把抠出来的 img 地址存放到 $img_array 变量中
    preg_match_all($reg, $message, $img_array, PREG_PATTERN_ORDER);
    //过滤重复的图片
    $img_array = array_unique($img_array[1]);
[/php]
第二步. 把$img_array 数组循环一下. 做图片保存和文章位置替换
[php]
    foreach ($img_array as $img){
        //判断是否是自己网站上的 图片
        if(xxx.com != get_domain($img)){// 如果这个图片不是自己服务器上的
            //读取图片文件
            $Gimg = new GetImage();
            $Gimg->source = $img;
            $Gimg->save_to = ./data/temp/;
            $FILE =  $Gimg->download(); //图片移动到本地
            //保存到相册 得到图片保存的位置
            $img_path = pic_save($FILE,0,);
            //文本路径替换
            $message = str_replace($img, $img_path, $message);
           
        }
    }

    ....这时候 $message 里面已经图片已经替换为自己服务器本地的地址,并且图片也保存到自己的服务器上.
[/php]


[php]
//下面一个函数 和 类是从网络上找的.

//从url中获得域名
function get_domain($url){
    $pattern = "/[w-]+.(com|net|org|gov|cc|biz|info|cn)(.(cn|hk))*/";
    preg_match($pattern, $url, $matches);
    if(count($matches) > 0) {
        return $matches[0];
    }else{
        $rs = parse_url($url);
        $main_url = $rs["host"];
        if(!strcmp(long2ip(sprintf("%u",ip2long($main_url))),$main_url)) {
            return $main_url;
        }else{
            $arr = explode(".",$main_url);
            $count=count($arr);
            $endArr = array("com","net","org","3322");//com.cn  net.cn 等情况
            if (in_array($arr[$count-2],$endArr)){
                $domain = $arr[$count-3].".".$arr[$count-2].".".$arr[$count-1];
            }else{
                $domain =  $arr[$count-2].".".$arr[$count-1];
            }
            return $domain;
        }// end if(!strcmp...)
    }// end if(count...)
}// end function

Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn