说下思路,利用PHP的curl函数储存cookie,google搜索页面是无法用file_get_connents打开的,必须要完全模拟浏览器才行,百度就不同了,直接用file_get_conntens抓取页面,然后用正则处理下就行了,这里就不列举百度了。
header("Content-Type: text/html;charset=utf-8");
function ggsearch($url_s, $keyword, $page = 1) {
$enKeyword = urlencode($keyword);
$rsState = false;
$page_num = ($page -1) * 10;
if ($page
$interface = "eth0:" . rand(1, 4); //避免GG封IP
$cookie_file = dirname(__FILE__) . "/temp/google.txt"; //存储cookie值
$url = "http://www.google.com/search?q=$enKeyword&hl=en&prmd=imvns&ei=JPnJTvLFI8HlggeXwbRl&start=$page_num&sa=N";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
//curl_setopt($ch, CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT']);//获取浏览器类型
curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5");
curl_setopt($ch, CURLOPT_INTERFACE, "$interface"); //指定访问IP地址
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file);
$contents = curl_exec($ch);
curl_close($ch);
$match = "!
preg_match_all("$match", "$contents", $line);
while (list ($k, $v) = each($line[0])) {
preg_match_all("!
]+>(.*?)!", $v, $title);
$num = count($title[1]);
for ($i = 0; $i
if (strstr($title[0][$i], $url_s)) {
$rsState = true;
$j = $i +1;
$sum = $j + (($page) * 10 - 10);
//echo $contents;
echo "关键字" . $keyword . "
" . "排名:" . '' . $sum . '' . "####" . "第" . ''.$page . ''. " 页" . "第" .''.$j . ''. "名" . $title[0][$i] . "
";
echo "" . "点击搜索结果" . "" . "
";
echo "
";
break;
}
}
}
unset ($contents);
if ($rsState === false) {
ggsearch($url_s, $keyword, ++ $page); //找不到搜索页面的继续往下搜索
}
} else {
echo '关键字' . $keyword . '10页之内没有该网站排名' . '
';
echo "
";
}
}
if (!empty ($_POST['submit'])) {
$time = explode(' ', microtime());
$start = $time[0] + $time[1];
$more_key = trim($_POST['textarea']);
$url_s = trim($_POST['url']);
if (!empty ($more_key) && !empty ($url_s)) {
/*判断输入字符的规律*/
if (strstr($more_key, "\n")) {
$exkey = explode("\n", $more_key);
}
if(strstr($more_key, "|")) {
$exkey = explode("|", $more_key);
}
if(!strstr($more_key, "\n")&&!strstr($more_key, "|")){
$exkey=array($more_key);
}
/*判断是否有www或者http://之类的东西*/
if (count(explode('.', $url_s))
$url = ltrim($url_s, 'http://www');
$url = 'www.' . $url_s;
}
foreach ($exkey as $keyword) {
//$keyword;
ggsearch($url_s, $keyword);
}
$endtime = explode(' ', microtime());
$end = $endtime[0] + $endtime[1];
echo '
';
echo '程序运行时间: ';
echo $end - $start;
//die();
}
}
?>
摘自Shine的圣天堂-〃敏〃

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。