在
使用PHP cURL可以简单和有效地去抓网页。你只需要运行一个脚本,然后分析一下你所抓取的网页,然后就可以以程序的方式得到你想要的数据了。无论是你想从从一个链接上取部分数据,或是取一个XML文件并把其导入数据库,那怕就是简单的获取网页内容,PHP cURL是一个功能强大的PHP库。本文主要讲述如果使用这个PHP库。
启用PHP cURL设置
首先,我们得先要确定我们的PHP是否开启了这个库,你可以通过使用php_info()函数来得到这一信息。
﹤?phpphpinfo();?﹥
如果你可以在网页上看到下面的输出,那么表示PHP cURL库已被开启。
如果你看到的话,那么你需要设置你的PHP并开启这个库。如果你是在Windows平台下,那么非常简单,你需要改一改你的php.ini文件的设置,找到php_curl.dll,并取消前面的分号注释就行了。如下所示:
//取消下在的注释extension=php_curl.dll
如果你是在Linux下面,那么,你需要重新编译你的PHP了,编辑时,你需要打开编译参数——在configure命令上加上“–with-curl” 参数。
一个小示例
如果一切就绪,下面是一个小例程:
﹤?php
// 初始化一个PHP cURL对象
$curl = curl_init();
// 设置你需要抓取的URL
curl_setopt($curl, CURLOPT_URL, 'http://cocre.com');
// 设置header
curl_setopt($curl, CURLOPT_HEADER, 1);
// 设置PHP cURL参数,要求结果保存到字符串中还是输出到屏幕上。
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
// 运行cURL,请求网页
$data = curl_exec($curl);
// 关闭URL请求
curl_close($curl);
// 显示获得的数据
var_dump($data);
如何POST数据
上面是抓取网页的代码,下面则是向某个网页POST数据。假设我们有一个处理表单的网址http://www.example.com/sendSMS.php,其可以接受两个表单域,一个是电话号码,一个是短信内容。
<ol class="dp-xml"> <li class="alt"><span><span>﹤ ?php </span></span></li> <li> <span>$</span><span class="attribute">phoneNumber</span><span> = </span><span class="attribute-value">'13912345678'</span><span>; </span> </li> <li class="alt"> <span>$</span><span class="attribute">message</span><span> = </span><span class="attribute-value">'This message was generated by curl and php'</span><span>;</span> </li> <li class="alt"> <span>$</span><span class="attribute">curlPost</span><span> = </span><span class="attribute-value">'pNUMBER='</span><span> . urlencode($phoneNumber) . </span> </li> <li class="alt"> <span>'&</span><span class="attribute">MESSAGE</span><span>=</span><span class="attribute-value">' . urlencode($message) . </span> </li> <li class="alt"> <span class="attribute-value">'</span><span>&</span><span class="attribute">SUBMIT</span><span>=</span><span class="attribute-value">Send</span><span>'; </span> </li> <li> <span>$</span><span class="attribute">ch</span><span> = </span><span class="attribute-value">curl_init</span><span>(); </span> </li> <li class="alt"><span>curl_setopt($ch, CURLOPT_URL, <br>'http://www.example.com/sendSMS.php'); </span></li> <li><span>curl_setopt($ch, CURLOPT_HEADER, 1); </span></li> <li class="alt"><span>curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); </span></li> <li><span>curl_setopt($ch, CURLOPT_POST, 1); </span></li> <li class="alt"> <span>curl_setopt($ch, CURLOPT_POSTFIELDS, <br>$curlPost);$</span><span class="attribute">data</span><span> = </span><span class="attribute-value">curl_exec</span><span>(); </span> </li> <li><span>curl_close($ch); </span></li> <li class="alt"><span>?﹥ </span></li> </ol>
从上面的程序我们可以看到,使用CURLOPT_POST设置HTTP协议的POST方法,而不是GET方法,然后以CURLOPT_POSTFIELDS设置POST的数据。
关于代理服务器
下面是一个如何使用代理服务器的示例。请注意其中高亮的代码,代码很简单,我就不用多说了。
<ol class="dp-xml"> <li class="alt"><span><span>﹤ ?php $</span><span class="attribute">ch</span><span> = </span><span class="attribute-value">curl_init</span><span>(); </span></span></li> <li><span>curl_setopt($ch, CURLOPT_URL, <br>'http://www.example.com'); </span></li> <li class="alt"><span>curl_setopt($ch, CURLOPT_HEADER, 1); </span></li> <li><span>curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); </span></li> <li class="alt"><span>curl_setopt($ch, CURLOPT_HTTPPROXYTUNNEL, 1); </span></li> <li><span>curl_setopt($ch, CURLOPT_PROXY, <br>'fakeproxy.com:1080'); </span></li> <li class="alt"><span>curl_setopt($ch, CURLOPT_PROXYUSERPWD, <br>'user:password'); </span></li> <li> <span>$</span><span class="attribute">data</span><span> = </span><span class="attribute-value">curl_exec</span><span>(); </span> </li> <li class="alt"><span>curl_close($ch); </span></li> <li><span>?﹥ </span></li> </ol>
关于其它更多的内容,请参看相关的PHP cURL手册。

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

Eclipse용 SAP NetWeaver 서버 어댑터
Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

Dreamweaver Mac版
시각적 웹 개발 도구

안전한 시험 브라우저
안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

MinGW - Windows용 미니멀리스트 GNU
이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.
