搜尋
首頁php教程php手册取得页面所有不重复连接的函数

函数|页面|重复

  由于需要我做了个函数,实现取得页面连接放到数组
  思路:1,取得静态+不带参数的:
  htm html asp php jsp cgi
  a,包含绝对路径的处理:直接取得
  preg_match_all ()?
  b,包含相对路径的,路径得到处理参数:
  根据情况(. 或 .. )处理得到绝对路径
  2,取得带参数的:
  3,经过筛选:选择了一些可以读的后缀比如asp,php,html等
  连接重复的进行删除。
  4,直接运行代码就把 落伍者论坛 » 网站建设专栏
  第一页面的连接拿下来到数组$e中,$e[o][0]为第一个连接;$e[o][1]为第2个
  
  
Code:

  $e=clinchgeturl("http://im286.com/forumdisplay.php?fid=1");
  
  var_dump($e);
  function clinchgeturl($url)
  {
  
  //$url="http://127.0.0.1/1.htm";
  //$rootpath="http://fsrootpathfsfsf/yyyyyy/";
  //var_dump($rrr);
  if(eregi('(.)*[\.](.)*',$url)){
   $roopath=split("\/",$url);
   $rootpath="http://".$roopath[2]."/";
   $nnn=count($roopath)-1;for($yu=3;$yu   // var_dump($rootpath); //http: ,'',127.0.0.1,xnml,index.php
   }
   else{$rootpath=$url;//var_dump($rootpath);
  }
  if(isset($url)){
  echo "$url 有下列裢接:
";
  $fcontents = file($url);
  while(list(,$line)=each($fcontents)){
  while(eregi('(href[[:space:]]*=[[:space:]]*"?[[:alnum:]:@/._-]+[\?]?[^\"]*"?)',$line,$regs)){
  //$regs[1] = eregi_replace('(href[[:space:]]*=[[:space:]]*\"?)([[:alnum:]:@/._-]+)(\"?)',"\\2",$regs[1]);
  $regs[1] = eregi_replace('(href[[:space:]]*=[[:space:]]*[\"]?)([[:alnum:]:@/._-]+[\?]?[^\"]*)(\.*)[^\"\/]*([\"]?)',"\\2",$regs[1]);
  
  if(!eregi('^http:\/\/',$regs[1])){
  
   if(eregi('^\.\.',$regs[1])){
   // $roopath=eregi_replace('(http:\/\/)?([[:alnum:]:@/._-]+)[[:alnum:]+](\.*)[[:alnum:]+]',"http:\/\/\\2",$url);
  
   $roopath=split("\/",$rootpath);
   $rootpath="http://".$roopath[2]."/";
   //echo "这是根本d :"."\n";
   $nnn=count($roopath)-1;for($yu=3;$yu   //var_dump($rootpath);
   if(eregi('^\.\.[\/[:alnum:]]',$regs[1])){
   //echo "这是../目录/ :"."\n";
   //$regs[1]="../xx/xxxxxx.xx";
   // $rr=split("\/",$regs[1]);
   //for($oooi=1;$oooi  $rrr=$regs[1];
   // {$rrr.="/".$rr[$oooi];
   $rrr = eregi_replace("^[\.][\.][\/]",'',$rrr); //}
  
   $regs[1]=$rootpath.$rrr;
  
  
   }
  
  
   }else{
   if(eregi('^[[:alnum:]]',$regs[1])){ $regs[1]=$rootpath.$regs[1]; }
  
   else{ $regs[1] = eregi_replace("^[\/]",'',$regs[1]);$regs[1]=$rootpath.$regs[1];}
  
   }
  
  
   }
  
  
  
  
  
  $line = $regs[2];
  if(eregi('(.)*[\.](htm|shtm|html|asp|aspx|php|jsp|cgi)(.)*',$regs[1])){
  $out[0][]=$regs[1]; }
  }
  }
  }for ($ouou=0;$ouou   {
   if($out[0][$ouou]==$out[0][$ouou+1]){
  $sameurlsum=1;
  //echo "sameurlsum=1:";
   for($sameurl=1;$sameurl   if($out[0][$ouou+$sameurl]==$out[0][$ouou+$sameurl+1]){$sameurlsum++;}
   else{break;}
   }
  
  
   for($p=$ouou;$p   { $out[0][$p]=$out[0][$p+$sameurlsum];}
   }
   }
  
  
  $i=0;
  while($out[0][++$i]) {
  //echo $root.$out[0][$i]."\r\n";
  $outed[0][$i]=$out[0][$i];
  
  }
  unset($out);
  $out=$outed; return $out;
  }
  ?>



陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能