首頁  >  文章  >  後端開發  >  採集 初級的用php寫的採集程序

採集 初級的用php寫的採集程序

WBOY
WBOY原創
2016-07-29 08:36:40827瀏覽

可以先用這個採集然後在用帝國處理
#################################################################################################### ########################################################### ######
#作者:9elong
#網址:個人小站不值一提
#時間:2007-01-01
#聲明:僅用於學習php之用。
#功能:採集單頁圖片。
#說明:3個示範表單已經寫好正規則用來示範。沒有任何功能說明,一切都在原始碼裡。附加論壇圖片擷取正規示範
######################################### ############################################
//把圖片從資訊頁面擷取下來的函數
function  getimg($url,$n,$key,$imgqian,$imgbiao,$titlekey)
{
               / /$titlekey圖片標題正規
                //$imgqian圖片位址前綴
                 global  $n;
                  $result;
                global  $imgadd;
                $msg=file_get_contents($url);
                以$key=str_replace("{圖片地址}","(.+)",$key);
                $key="|".$key."|isU";
                     $c=count($result[0]);
                for($i=0;$i                            $img=$result[0][$i]."
";
       if(ereg( "^.*".$imgbiao.".*$",$img))
                                                                                              |http://(.+)jpg|isU",$img,$img); $imgadd[$n]=$img[0];
                          "採集 初級的用php寫的採集程序
";
                          🎜>                                }
                              elseif(ereg                     {為
                          preg_match("|http://(.+)jpg|isU",$img, $ img );
                               match ($ Titlekey, $ MSG, $ Title); // Echo $ Title [0 ];
                返回  $n ; ################################################## #####
#不支援file_get_contents()函數可以使用下面的替換
#$i=0;
#$handle=@fopen($url,"rb");
#while (!@feof($handle))
#{
#                $buffer[$i]=         $buffer[$
#                $i++;
#}
#fclose($handle);
#$msg=join("",$buffer);
###################### ########################################################### #############
if($_GET['act']=="getimgadd"&&$_POST['url']!="")
{
$url=$_POST['url'];
        getimg($url,"0",$_POST['key'],$_POST['imgqian'],$_POST['imgbiao'],$_POST['imgqian'],$_POST['imgbiao'],$_POST[ 'titlekey']);
##################################################################################################################### ###########################################
        //取得分頁
                if($_POST['getpage']=="是")
                   $_POST['page']=str_replace("{分頁位址}","(.+)",$ _POST['page']);
                $page="|".$_POST['page']."|isU";         preg_match_all($page,$msg ,$presult);
                if($_POST['pc']==""||$_POST['pc']=="   $pc=count($presult[0]) ;
                else
             ;
                if($_POST['pc']>count($presult[0]))
         $pc=count($ presult[0]);
                for($i=1;$i                            $pageurl=$presult[0][$i]       // echo  $pageurl."
";
                                if(ereg("^.*[1-9].*$",$pageurl))
                                {
                                                $pageurl=str_replace("                     $pagekey=str_replace("{關鍵位址}","(.+)",$_POST['pagekey']);
                       $pagekey="|".$pagekey."|isU";
                         ($pagekey,$pageurl,$N3[ $i]);
                               i][0])."
";
                           [$i][0],$n,$_POST[ 'key'],$_POST['imgqian'],$_POST['imgbiao'],$_POST['titlekey']);
                           }
        }
#################################################################################################### ########################################################### #############################
        echo  "圖片集〖".$title[1]."〗".$" n."張圖片被抓取
回頁首頁
";
                while(list($num,$m,$Sm)=each($mnum,$img. ))
                {且
             ]=="圖片")
                                                          echo  "採集 初級的用php寫的採集程序
;
                                           else
                                  }
##################### ########################################################### #############
                //exit();
}
?>
實例1();
}
?>
實例1();
}
?>
實例1();
} ?> 實例1(頁數,使用了簡單的分頁數

輸入圖片位址
圖片地址正規图片地址前缀

图片地址标识

图片标题正则

分頁位址正規.[0-9]'>

分頁位址模式










實例2(資訊頁沒有分頁,所以分頁正規為空白):

輸入圖片地址

圖片地址正規
採集 初級的用php寫的採集程序

圖片位址前綴

圖片位址標識

圖片標題正規{圖片標題}'>

分页地址正则

分页地址模式










实例3(信息页没有分页,所以分页正则为空,图片为绝对地址,所以图片地址前缀为空):

输入图片地址

图片地址正则

图片地址前缀

图片地址标识

图片标题正则

分頁位址正則

分頁位址模式










華聲論壇圖片為附件http://bbs.hnol.net/dispbbs2.asp?boardID=50&ID=336436
圖片位址正規:upload=jpg{圖片位址}upload
圖片位址識別:bbs
圖片標題正規:貼文主題:{圖片標題}
華聲論壇圖片為外鏈http://bbs.hnol.net/dispbbs2.asp?boardID=50&ID=336253
圖片位址正規:img]{圖片位址}/img 圖片位址標識:jpg

圖片標題正規:貼文主題:{圖片標題}

以上就介紹了採集 初級的用php寫的採集程序,包括了採集方面的內容,希望對PHP教程有興趣的朋友有所幫助。

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn