이 글의 내용은 Baidu 검색결과 페이지의 [관련 검색어]를 크롤링하고 저장하는 내용입니다. 이제 필요한 친구들이 참고할 수 있도록 공유하겠습니다. 바이두 검색어 [시치쉘 회사 이전]
[시치드 쉘 회사 이전] 검색 링크https://www.baidu.com/s?wd=%E7%9F%A5%E4%BA% 86 %E5%A3%B3%E5%85%AC%E5%8F%B8%E8%BD%AC%E8%AE%A9
**搜索结果部分源代码** <p id="rs"><p class="tt">相关搜索</p><table cellpadding="0"><tbody><tr><th> <a href="/s?wd=%E5%85%AC%E5%8F%B8%E8%BD%AC%E8%AE%A9%E6%B5%81%E7%A8%8B%E7%9F%A5%E4%BA%86%E5%A3%B3&rsp=0&f=1&oq=%E7%9F%A5%E4%BA%86%E5%A3%B3%E5%85%AC%E5%8F%B8%E8%BD%AC%E8%AE%A9&tn=baiduhome_pg&ie=utf-8&rsv_idx=2&rsv_pq=88c7804a0000c417&rsv_t=b5f3JkJIsj6Nkp61K%2BmmVGeev7UP95o1HSJTUoIS2xV4SsmZxvOoVf%2BAZaVoihB%2BT3bg&rqlang=cn&rsv_ers=xn0&rs_src=0&rsv_pq=88c7804a0000c417&rsv_t=b5f3JkJIsj6Nkp61K%2BmmVGeev7UP95o1HSJTUoIS2xV4SsmZxvOoVf%2BAZaVoihB%2BT3bg">公司转让流程知了壳</a></th> ..... ..... <th><a href="/s?wd=%E7%9F%A5%E4%BA%86%E5%A3%B3%E5%85%AC%E5%8F%B8%E6%B3%A8%E5%86%8C&rsp=8&f=1&oq=%E7%9F%A5%E4%BA%86%E5%A3%B3%E5%85%AC%E5%8F%B8%E8%BD%AC%E8%AE%A9&tn=baiduhome_pg&ie=utf-8&rsv_idx=2&rsv_pq=88c7804a0000c417&rsv_t=b5f3JkJIsj6Nkp61K%2BmmVGeev7UP95o1HSJTUoIS2xV4SsmZxvOoVf%2BAZaVoihB%2BT3bg&rqlang=cn&rsv_ers=xn0&rs_src=0&rsv_pq=88c7804a0000c417&rsv_t=b5f3JkJIsj6Nkp61K%2BmmVGeev7UP95o1HSJTUoIS2xV4SsmZxvOoVf%2BAZaVoihB%2BT3bg">知了壳公司注册</a></th></tr></tbody></table></p>
2. 로컬을 잡아서 저장
소스 코드
index.php------------ <form action="index.php" method="post"> <input name="q" type="text" /> <input type="submit" value="Get Keywords" /> </form> <?php header('Content-Type:text/html;charset=gbk'); class ComBaike{ private $o_String=NULL; public function __construct(){ include('cls.StringEx.php'); $this->o_String=new StringEx(); } public function getItem($word){ $url = "http://www.baidu.com/s?wd=".$word; // 构造包头,模拟浏览器请求 $header = array ( "Host:www.baidu.com", "Content-Type:application/x-www-form-urlencoded",//post请求 "Connection: keep-alive", 'Referer:http://www.baidu.com', 'User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; BIDUBrowser 2.6)' ); $ch = curl_init (); curl_setopt ( $ch, CURLOPT_URL, $url ); curl_setopt ( $ch, CURLOPT_HTTPHEADER, $header ); curl_setopt ( $ch, CURLOPT_RETURNTRANSFER, 1 ); $content = curl_exec ( $ch ); if ($content == FALSE) { echo "error:" . curl_error ( $ch ); } curl_close ( $ch ); //输出结果echo $content; $this->o_String->string=$content; $s_begin='<p id="rs">'; $s_end='</p>'; $summary=$this->o_String->getPart($s_begin,$s_end); $s_begin='<p class="tt">相关搜索</p><table cellpadding="0"><tr><th>'; $s_end='</th></tr></table></p>'; $content=$this->o_String->getPart($s_begin,$s_end); return $content; } public function __destruct(){ unset($this->o_String); } } if($_POST){ $com = new ComBaike(); $q = $_POST['q']; $str = $com->getItem($q); //获取搜索内容 $pat = '/<a(.*?)href="(.*?)"(.*?)>(.*?)<\/a>/i'; preg_match_all($pat, $str, $m); //print_r($m[4]); 链接文字 $con = implode(",", $m[4]); //生成文件夹 $dates = date("Ymd"); $path="./Search/".$dates."/"; if(!is_dir($path)){ mkdir($path,0777,true); } //生成文件 $file = fopen($path.iconv("UTF-8","GBK",$q).".txt",'w'); if(fwrite($file,$con)){ echo $con; echo '<script>alert("success")</script>'; }else{ echo '<script>alert("error")</script>'; } fclose($file); } ?> cls.StringEx.php------------- <?php header('Content-Type: text/html; charset=UTF-8'); class StringEx{ public $string=''; public function __construct($string=''){ $this->string=$string; } public function pregGetPart($s_begin,$s_end){ $s_begin==preg_quote($s_begin); $s_begin=str_replace('/','\/',$s_begin); $s_end=preg_quote($s_end); $s_end=str_replace('/','\/',$s_end); $pattern='/'.$s_begin.'(.*?)'.$s_end.'/'; $result=preg_match($pattern,$this->string,$a_match); if(!$result){ return $result; }else{ return isset($a_match[1])?$a_match[1]:''; } } public function strstrGetPart($s_begin,$s_end){ $string=strstr($this->string,$s_begin); $string=strstr($string,$s_end,true); $string=str_replace($s_begin,'',$string); $string=str_replace($s_end,'',$string); return $string; } public function getPart($s_begin,$s_end){ $result=$this->pregGetPart($s_begin,$s_end); if(!$result){ $result=$this->strstrGetPart($s_begin,$s_end); } return $result; } } ?>관련 권장 사항:
php 크롤링 페이지 왜곡 분석
위 내용은 PHP는 Baidu 검색 결과 페이지에서 [관련 검색어]를 가져와 저장합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

php把负数转为正整数的方法:1、使用abs()函数将负数转为正数,使用intval()函数对正数取整,转为正整数,语法“intval(abs($number))”;2、利用“~”位运算符将负数取反加一,语法“~$number + 1”。

实现方法:1、使用“sleep(延迟秒数)”语句,可延迟执行函数若干秒;2、使用“time_nanosleep(延迟秒数,延迟纳秒数)”语句,可延迟执行函数若干秒和纳秒;3、使用“time_sleep_until(time()+7)”语句。

php字符串有下标。在PHP中,下标不仅可以应用于数组和对象,还可应用于字符串,利用字符串的下标和中括号“[]”可以访问指定索引位置的字符,并对该字符进行读写,语法“字符串名[下标值]”;字符串的下标值(索引值)只能是整数类型,起始值为0。

php除以100保留两位小数的方法:1、利用“/”运算符进行除法运算,语法“数值 / 100”;2、使用“number_format(除法结果, 2)”或“sprintf("%.2f",除法结果)”语句进行四舍五入的处理值,并保留两位小数。

在php中,可以使用substr()函数来读取字符串后几个字符,只需要将该函数的第二个参数设置为负值,第三个参数省略即可;语法为“substr(字符串,-n)”,表示读取从字符串结尾处向前数第n个字符开始,直到字符串结尾的全部字符。

判断方法:1、使用“strtotime("年-月-日")”语句将给定的年月日转换为时间戳格式;2、用“date("z",时间戳)+1”语句计算指定时间戳是一年的第几天。date()返回的天数是从0开始计算的,因此真实天数需要在此基础上加1。

方法:1、用“str_replace(" ","其他字符",$str)”语句,可将nbsp符替换为其他字符;2、用“preg_replace("/(\s|\ \;||\xc2\xa0)/","其他字符",$str)”语句。

查找方法:1、用strpos(),语法“strpos("字符串值","查找子串")+1”;2、用stripos(),语法“strpos("字符串值","查找子串")+1”。因为字符串是从0开始计数的,因此两个函数获取的位置需要进行加1处理。


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

PhpStorm 맥 버전
최신(2018.2.1) 전문 PHP 통합 개발 도구

Atom Editor Mac 버전 다운로드
가장 인기 있는 오픈 소스 편집기

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

Dreamweaver Mac版
시각적 웹 개발 도구

뜨거운 주제



