요 며칠 php로 컬 라이브러리를 공부해서 간단한 바이두 검색을 해봤습니다. 먼저 코드를 입력해 봤습니다.
<div style="width:200px;height:100px;"> <div>百度搜索</div> <form action="" method="get"> <input type="text" name="key"> <input type="submit" value="搜索"> </form> </div> <?php $k = ''; $k = !empty($_GET['key'])?$_GET['key']:''; session_start(); $_SESSION['key'] = $k; $curl = curl_init(); // 设置你需要抓取的URL for($i = 0;$i<2;$i++){ curl_setopt($curl, CURLOPT_URL, "http://www.baidu.com/s?wd={$_SESSION['key']}&pn={$i}"); // 设置header curl_setopt($curl, CURLOPT_HEADER, 1); // 设置cURL 参数,要求结果保存到字符串中还是输出到屏幕上。 curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); // 运行cURL,请求网页 $data = curl_exec($curl); $pre = '/<h3 class="t"><a.*?href = "(.*?)".*?target="_blank".*?>(.*?)<\/a><\/h3>/s'; preg_match_all($pre,$data,$match); foreach ($match[1] as $k => $v) { ?> <div style="font-size:20px;color:red;"> <a href="<?php echo $v;?>" target="_blank"><?php echo strip_tags($match[2][$k]);?></a> </div> <?php } } curl_close($curl); ?>
바이두 검색에서 URL을 분석한 결과, 패턴
https://www.baidu.com/s?wd=키워드 검색
그런데 https 프로토콜을 사용해본 결과 바이두에서 데이터를 얻을 수 없다는 것을 발견해서 http://www.baidu.com?wd=키워드로 검색하시면 됩니다!!