>백엔드 개발 >PHP 튜토리얼 >Curl을 사용하여 PHP를 사용하여 로그인을 시뮬레이션하고 데이터를 캡처하는 단계에 대한 자세한 설명

Curl을 사용하여 PHP를 사용하여 로그인을 시뮬레이션하고 데이터를 캡처하는 단계에 대한 자세한 설명

php中世界最好的语言
php中世界最好的语言원래의
2018-05-16 11:57:482094검색

이번에는 PHP를 사용하여 Curl을 사용하여 로그인을 시뮬레이션하고 데이터를 캡처하는 단계에 대해 자세히 설명하겠습니다. PHP에서 Curl을 사용하여 시뮬레이션된 로그인 및 데이터 캡처를 구현하는 데 있어 주의사항은 무엇입니까? , 살펴 보겠습니다.

PHP의 Curl 확장 라이브러리를 사용하면 로그인을 시뮬레이션하고 사용자 계정으로 로그인해야만 볼 수 있는 일부 데이터를 캡처할 수 있습니다. 구체적인 구현 과정은 다음과 같습니다(개인 요약):

1. 먼저 해당 로그인 페이지의 HTML 소스 코드를 분석하여 몇 가지 필요한 정보를 얻어야 합니다.

(1) 로그인 페이지 주소

(2) 인증 코드 주소

(3) 로그인 양식에 제출해야 하는 각 필드의 이름 및 제출 방법

(4) 로그인 양식을 제출할 주소;

(5) 또한, 캡처할 데이터가 어디에 있는지 주소를 알아야 합니다.

2. 쿠키를 받아 저장하세요(쿠키 파일을 사용하는 웹사이트의 경우):

$login_url = 'http://www.xxxxx';  //登录页面地址
$cookie_file = dirname(FILE)."/pic.cookie";  //cookie文件存放位置(自定义)
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $login_url);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file);
curl_exec($ch);
curl_close($ch);

3. 인증 코드를 받고 저장하세요(인증 코드를 사용하는 웹사이트의 경우):

$verify_url = "http://www.xxxx";   //验证码地址
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $verify_url);
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$verify_img = curl_exec($ch);
curl_close($ch);
$fp = fopen("./verify/verifyCode.png",'w');  //把抓取到的图片文件写入本地图片文件保存
fwrite($fp, $verify_img);
fclose($fp);

지침:

인증 코드 식별을 구현할 수 없으므로 여기서 수행하는 작업은 인증 코드 이미지를 캡처하여 로컬 파일에 저장한 다음 이를 내 프로젝트의 html 페이지에 표시하고 사용자가 입력하도록 한 다음 사용자를 기다리는 것입니다. 계좌번호, 비밀번호, 인증번호를 입력하고 제출 버튼을 클릭한 후 다음 단계로 진행하세요.

4. 로그인 양식 제출 시뮬레이션:

$ post_url = 'http://www.xxxx';   //登录表单提交地址
$post = "username=$account&password=$password&seccodeverify=$verifyCode";//表单提交的数据(根据表单字段名和用户输入决定)
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $ post_url);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch, CURLOPT_POSTFIELDS, $post);     //提交方式为post
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);
curl_exec($ch);
curl_close($ch);

5. 데이터 캡처:

$data_url = "http://www.xxxx";   //数据所在地址
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $data_url);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,0);
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);
$data = curl_exec($ch);
curl_close($ch);

지금까지 데이터가 있는 페이지가 캡처되어

string

변수 $data에 저장되었습니다. 캡쳐된 것은 웹페이지의 html 소스 코드라는 점에 유의해야 합니다. 즉, 이 문자열에는 원하는 데이터가 포함될 뿐만 아니라 많은

html 태그

및 기타 원하지 않는 항목도 포함되어 있습니다. 그래서 필요한 데이터를 추출하려면 데이터가 저장되어 있는 페이지의 HTML 코드를 분석한 뒤 문자열 조작 기능, 정규 매칭, 기타 방법을 결합해 원하는 데이터를 추출해야 한다. 위 방법은 http 프로토콜을 사용하는 일반 웹사이트에 효과적입니다. 하지만 https 프로토콜을 사용하는 웹사이트에 대한 로그인을 시뮬레이션하려면 다음 처리를 추가해야 합니다.

1. https 확인 건너뛰기:

curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);

2. 사용자 에이전트 사용:

$UserAgent = 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; .NET CLR 3.0.04506; .NET CLR 3.5.21022; .NET CLR 1.0.3705; .NET CLR 1.1.4322)';
curl_setopt($curl, CURLOPT_USERAGENT, $UserAgent);

참고:

추가하지 마십시오. 이러한 프로세스를 사용하면 시뮬레이션된 로그인이 성공하지 못합니다. 위 프로그램을 사용하여 웹 사이트 로그인을 시뮬레이션하는 것은 일반적으로 성공적이지만 실제로는 시뮬레이션되는 웹 사이트의 특정 조건을 기반으로 고려해야 합니다. 예를 들어 일부 웹사이트의 인코딩이 다르기 때문에 캡처한 페이지가 깨졌습니다. 이때 다음과 같은 인코딩 변환을 수행해야 합니다.

, gbk 인코딩을 utf8 인코딩으로 변환합니다. 인라인 프레임에 인증 코드를 삽입하는 온라인 뱅킹과 같이 상대적으로 보안 요구 사항이 높은 일부 웹사이트도 있습니다. 이 경우 먼저 인라인 프레임의 페이지를 크롤링한 다음 인증 주소를 추출해야 합니다. 가서 인증 코드를 다시 받아보세요. 또한 js 코드로 양식을 제출하는 일부 웹사이트(예: 온라인 뱅킹)도 있습니다. 양식을 제출하기 전에 암호화 등 일부 처리도 수행하므로 직접 제출하면 양식을 제출할 수 없습니다. 성공적으로 로그인을 하셔야 합니다. 비슷한 처리를 한 후 제출해야 하는데, 이 경우 암호화 등 js 코드에서 수행되는 특정 작업을 알 수 있고, 암호화 알고리즘이 무엇인지 알 수 있다면 동일한 처리를 수행할 수 있습니다. , 그리고 데이터를 제출하면 성공할 수도 있습니다. 그러나 여기에 핵심이 있습니다. 예를 들어 암호화되어 있지만 특정 암호화 알고리즘을 모르는 경우 수행하는 작업을 전혀 모르는 경우 동일한 작업을 수행할 수 없습니다. , 성공적으로 시뮬레이션할 수 없습니다. 이와 관련된 일반적인 사례는 온라인 뱅킹 제어를 사용하여 js 코드로 양식을 제출하기 전에 사용자가 제출한 비밀번호 및 확인 코드에 대해 일부 처리를 수행하는 것입니다. 그래서 우리는 그것을 시뮬레이션할 수 없습니다. 따라서 이 글을 읽고 나서 온라인 뱅킹 로그인을 시뮬레이션할 수 있다고 생각한다면, 은행 웹사이트 로그인을 그렇게 쉽게 시뮬레이션할 수 있습니까? 물론, 온라인 뱅킹 통제를 뚫을 수 있다면 그것은 또 다른 문제입니다. 그런데 왜 이 문제에 직면했는지, 말하지 않으면 너무 많이 말하면 눈물이 납니다. . .

이 기사의 사례를 읽으신 후 방법을 마스터하셨다고 생각합니다. 더 흥미로운 정보를 보려면 PHP 중국어 웹사이트의 다른 관련 기사를 주목하세요!

추천 도서:

고동시성 잠금 트랜잭션을 처리하는 PHP+MySQL 단계에 대한 자세한 설명

장바구니 결제 방법 요약

위 내용은 Curl을 사용하여 PHP를 사용하여 로그인을 시뮬레이션하고 데이터를 캡처하는 단계에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.