この記事では、Python を使用してスライディング検証コードをクラックする方法を紹介します。一定の参考値があるので、困っている友達が参考になれば幸いです。
クロールを実行すると、常にさまざまなクロール対策の制限が発生します。クロールに対する防御の第一線はログイン時に表示されることがよくあります。クローラーの自動ログインを制限するには, 道が高ければ高いほど、悪魔も高くなるという諺の通り、各家族は最善を尽くしました。
今日は、スライド写真の認証コードを簡単に処理する方法の事例を共有します。
スライダーをドラッグして画像のノッチに一致させるこのようなログイン検証は、より正確であるため、多くの Web サイトやアプリで一般的です。ユーザー エクスペリエンスはフレンドリーで、簡単に識別できます。同時に、ほとんどのプライマリ クローラーを傍受することもできます。
Python クローラーとして、この検証プロセスを自動的に正しく完了するにはどうすればよいでしょうか?
まず分析してみましょう。実際に中心的な問題は、ターゲット ギャップの位置を見つける方法です。位置がわかったら、Selenium などのツールを使用してドラッグ操作を完了できます。
opencv を使用してこの問題を解決できます。主な手順は次のとおりです:
opencv とは何ですか?
OpenCV (オープン ソース コンピューター ビジョン ライブラリ) は、オープン ソースのコンピューター ビジョン ライブラリです。主なアルゴリズムには、画像処理、コンピューター ビジョン、機械学習関連のメソッドが含まれています。リアルタイムの画像処理、コンピューターの開発に使用できます。視覚およびパターン認識プログラム。
直接インストール
最初に画像に対してガウスぼかし処理を実行します。ガウスぼかしの主な機能は画像のノイズを低減することであり、前処理段階。
#処理後の効果 #次に、Canny エッジ検出を使用して、「狭い境界」を含むバイナリ値を取得します。画像。いわゆるバイナリ画像は白黒画像であり、白と黒のみです。 輪郭検出 すべての輪郭を見つけて赤い線を使用します。フレームが描画され、マークが付けられ、大小合わせて数十の輪郭があることがわかります。 残りの問題は簡単に解決できます。計算するだけです。輪郭の領域または周囲範囲を制限することにより、ターゲット位置の輪郭サイズが事前に決定されている場合、ターゲット輪郭の位置をフィルターで除外できます。 輪郭の面積は 6000 ~ 8000、周囲長は 300 ~ 500 です。最後に、囲む長方形を使用して座標位置、幅を取得します。そして輪郭の高さ。 ターゲットの位置は上記のように見つかりました。残りの作業は、スライダーを指定した位置に移動することです関連する無料学習の推奨事項:Pythonビデオチュートリアル!
以上がクローラーを使用してスライディング検証コードを解読する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。