Heim >Backend-Entwicklung >PHP-Tutorial >Ausführliche Erläuterung der Schritte zum Simulieren der Anmeldung und Erfassung von Daten mithilfe von PHP mit Curl
Dieses Mal werde ich Ihnen eine detaillierte Erklärung der Schritte zur Verwendung von Curl zum Simulieren von Anmelde- und Erfassungsdaten in PHP geben. Welche Vorsichtsmaßnahmen es gibt, damit PHP Curl zum Simulieren von Anmelde- und Erfassungsdaten verwenden kann Sind die tatsächlichen Fälle, einer aufstehen und einen Blick darauf werfen.
Mit der Curl-Erweiterungsbibliothek von PHP können Sie die Anmeldung simulieren und einige Daten erfassen, die nur nach der Anmeldung mit einem Benutzerkonto angezeigt werden können. Der spezifische Implementierungsprozess ist wie folgt (persönliche Zusammenfassung):
1. Zuerst müssen Sie den HTML-Quellcode der entsprechenden Anmeldeseite analysieren, um einige notwendige Informationen zu erhalten:
(1) Die Adresse der Anmeldeseite;
(2) Die Adresse des Bestätigungscodes
(3) Der Name und die Übermittlungsmethode jedes Felds, das eingereicht werden muss das Anmeldeformular; (4) Die im Anmeldeformular angegebene Adresse (5) Darüber hinaus müssen Sie die Adresse kennen, an der sich die zu erfassenden Daten befinden. 2. Holen Sie sich Cookies und speichern Sie sie (für Websites, die Cookie-Dateien verwenden):$login_url = 'http://www.xxxxx'; //登录页面地址 $cookie_file = dirname(FILE)."/pic.cookie"; //cookie文件存放位置(自定义) $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $login_url); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file); curl_exec($ch); curl_close($ch);3. Holen Sie sich Bestätigungscodes und speichern Sie sie (für Websites, die Bestätigungscodes verwenden):
$verify_url = "http://www.xxxx"; //验证码地址 $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $verify_url); curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); $verify_img = curl_exec($ch); curl_close($ch); $fp = fopen("./verify/verifyCode.png",'w'); //把抓取到的图片文件写入本地图片文件保存 fwrite($fp, $verify_img); fclose($fp);
Hinweis:
Da der Bestätigungscode nicht erkannt werden kann, erfasse ich hier das Bild des Bestätigungscodes, speichere es in einer lokalen Datei und füge es dann der hinzu html in meinem Projekt Es wird auf der Seite angezeigt und ermöglicht dem Benutzer das Ausfüllen. Warten Sie, bis der Benutzer die Kontonummer, das Passwort und den Bestätigungscode eingegeben hat, und klicken Sie auf die Schaltfläche „Senden“, bevor Sie mit dem nächsten Schritt fortfahren. 4. Absenden des Anmeldeformulars simulieren:$ post_url = 'http://www.xxxx'; //登录表单提交地址 $post = "username=$account&password=$password&seccodeverify=$verifyCode";//表单提交的数据(根据表单字段名和用户输入决定) $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $ post_url); curl_setopt($ch, CURLOPT_HEADER, false); curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); curl_setopt($ch, CURLOPT_POSTFIELDS, $post); //提交方式为post curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file); curl_exec($ch); curl_close($ch);5. Daten erfassen:
$data_url = "http://www.xxxx"; //数据所在地址 $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $data_url); curl_setopt($ch, CURLOPT_HEADER, false); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER,0); curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file); $data = curl_exec($ch); curl_close($ch);Bisher wurde die Seite, auf der sich die Daten befinden, erfasst und gespeichert
Zeichenfolge Variable $data.
Es ist zu beachten, dass es sich bei der Erfassung um den HTML-Quellcode einer Webseite handelt. Dies bedeutet, dass diese Zeichenfolge nicht nur die gewünschten Daten enthält, sondern auch viele Die obige Methode ist für allgemeine Websites effektiv, die das http-Protokoll verwenden. Wenn Sie jedoch die Anmeldung bei einer Website simulieren möchten, die das https-Protokoll verwendet, müssen Sie die folgende Verarbeitung hinzufügen: 1 https-Überprüfung überspringen:curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);2 🎜 >
$UserAgent = 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; .NET CLR 3.0.04506; .NET CLR 3.5.21022; .NET CLR 1.0.3705; .NET CLR 1.1.4322)'; curl_setopt($curl, CURLOPT_USERAGENT, $UserAgent);Hinweis:
Wenn Sie diese Prozesse nicht hinzufügen, wird die simulierte Anmeldung nicht erfolgreich sein. Die Verwendung des oben genannten Programms zur Simulation der Anmeldung auf einer Website ist im Allgemeinen erfolgreich, muss jedoch tatsächlich noch auf der Grundlage der spezifischen Umstände der simulierten Anmeldewebsite in Betracht gezogen werden. Beispiel: Einige Websites haben unterschiedliche Codierungen, sodass die von Ihnen erfassten Seiten verstümmelt sind. Zu diesem Zeitpunkt müssen Sie eine Codierungskonvertierung durchführen, z. B.:
, GBK-Codierung in UTF8-Codierung konvertieren. Es gibt auch einige Websites mit relativ hohen Sicherheitsanforderungen, wie z. B. Online-Banking, die den Verifizierungscode in einen Inline-Frame einfügen. In diesem Fall müssen Sie zuerst die Seite des Inline-Frames crawlen und dann die Adresse der Verifizierung extrahieren Holen Sie sich den Bestätigungscode noch einmal. Es gibt auch einige Websites (z. B. Online-Banking), die Formulare im JS-Code senden. Vor dem Absenden des Formulars werden auch einige Verarbeitungsschritte wie Verschlüsselung usw. durchgeführt. Wenn Sie es also direkt senden, ist dies nicht möglich Sie müssen sich erfolgreich anmelden, nachdem Sie eine ähnliche Verarbeitung durchgeführt haben. In diesem Fall können Sie jedoch die gleiche Verarbeitung durchführen, wenn Sie die im js-Code ausgeführten spezifischen Vorgänge kennen, z. B. die Verschlüsselung , und dann die Daten übermitteln, damit es auch erfolgreich sein kann. Hier kommt jedoch der entscheidende Punkt: Wenn Sie nicht wissen, welche Vorgänge es überhaupt ausführt, z. B. wenn es verschlüsselt ist, Sie aber den spezifischen Verschlüsselungsalgorithmus nicht kennen, können Sie denselben Vorgang nicht ausführen , und Sie können es nicht erfolgreich simulieren. Ein typischer Fall in dieser Hinsicht ist das Online-Banking, bei dem Online-Banking-Steuerelemente verwendet werden, um das vom Benutzer übermittelte Passwort und den Bestätigungscode vor dem Absenden des Formulars im js-Code zu verarbeiten. Wir wissen jedoch nicht, welche Vorgänge es ausführt wir können es nicht simulieren. Wenn Sie also denken, Sie könnten die Anmeldung beim Online-Banking simulieren, nachdem Sie diesen Artikel gelesen haben, dann sind Sie zu naiv. Können Sie die Anmeldung auf der Website der Bank so einfach simulieren? Wenn es Ihnen gelingt, die Online-Banking-Kontrollen zu knacken, ist das natürlich eine andere Sache. Warum bin ich jedoch so tief berührt, weil ich auf dieses Problem gestoßen bin? Wenn ich nicht darüber rede, werde ich Tränen vergießen, wenn ich zu viel rede. . .Ich glaube, dass Sie die Methode beherrschen, nachdem Sie den Fall in diesem Artikel gelesen haben. Weitere spannende Informationen finden Sie in anderen verwandten Artikeln auf der chinesischen PHP-Website!
Empfohlene Lektüre:
A Zusammenfassung der Warenkorb-Abrechnungsmethode
Das obige ist der detaillierte Inhalt vonAusführliche Erläuterung der Schritte zum Simulieren der Anmeldung und Erfassung von Daten mithilfe von PHP mit Curl. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!