Maison > Article > développement back-end > Applet de collecte implémenté en PHP, une lecture incontournable pour ceux qui souhaitent collecter des données
Ce qui suit est une applet de collection implémentée en PHP que j'ai collectée. Elle peut être utilisée pour tester par vous-même. C'est très pratique pour la collecte !
<?php //调用方法 :localhost/2.php?id=1 (自动采集1-8的列表) header("Content-type:text/html;charset=utf-8"); $con =mysql_connect("localhost", "root", "huweishen.com") or die("数据库链接错误"); mysql_select_db("liuyan", $con); mysql_query("set names 'utf8'"); function preg_substr($start, $end, $str) // 正则截取函数 { $temp = preg_split($start, $str); $content = preg_split($end, $temp[1]); return $content[0]; } function str_substr($start, $end, $str) // 字符串截取函数 { $temp = explode($start, $str, 2); $content = explode($end, $temp[1], 2); return $content[0]; } // ---------------- 使用实例 ---------------- if($_GET['id']<=8&&$_GET['id']){ $id=$_GET['id']; $url = "http://www.037c.com/New/list_5_$id.html"; //目标站 $fp = fopen($url, "r") or die("超时"); $fcontents = file_get_contents($url); $pattern="/<\/span><a href=\"(.*)\" title=\"(.*)\" target=\"_blank\">/iUs";//正则 preg_match_all($pattern, $fcontents, $arr); //print_r($arr); foreach($arr[1] as $k=>$url) { $title = iconv('GB2312', 'UTF-8', addslashes($arr[2][$k])); // echo $title; // echo $url; $str = iconv("GB2312","UTF-8", file_get_contents($url)); $author = preg_substr("/作者:/", "/<\//", $str); // 通过正则提取作者 $content = str_substr('<p class="wltg">', '</p>', $str); //通过字符串提取标题 $sql = "INSERT INTO `caiji` (`title`, `url` , `content`, `author` ) VALUES ('$title', '$url' , '$content' , '$author')"; // echo $sql."<br/>"; mysql_query($sql); } $id++; echo "正在采集URL数据列表$id...请稍后..."; echo "<script>window.location='2.php?id=$id'</script>"; } else{ echo "采集数据结束。"; } ?>
Le paramètre de titre est unique, ce qui peut empêcher une collecte répétée. C'est une très bonne applet de collection php, auteur : Fengyun Wuji
.Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!