php を使用して Http リクエストを送信し、Web ページ データをキャプチャします
j2ee または Android 開発を行ったことがある人なら、多かれ少なかれ Apache の HttpClient クラス ライブラリを使用したことがあるはずです。このクラス ライブラリは、非常に強力なサーバー側 HTTP リクエスト操作を提供します。開発時に使用すると非常に便利です。
最近、PHP開発をしていると、サーバー側でhttpリクエストを送って、それを処理してクライアントに返すという作業もソケットを使えばそれほど面倒ではないかもしれません。 PHPのクラスライブラリにHttpClientのようなものがないか調べてみました。
Google で、PHP に本当にそのようなクラス ライブラリがあることを発見しました。名前は HTTPClient です。一見すると、何年も更新されておらず、機能が制限されていることがわかりました。ああ。そこで、別のクラス ライブラリである Snoopy を見つけました。このクラス ライブラリについてはあまり知りませんでしたが、オンラインでの反応が非常に良かったので、これを使用することにしました。その API の使用法は Apache の HttpClient とは大きく異なりますが、それでも非常に使いやすいです。また、ページ内のフォームのみを取得する、またはすべてのリンクを取得するなど、多くの特別な目的のメソッドが提供されます。
include 'Snoopy.class.php'; $snoopy = new Snoopy(); $snoopy->fetch("http://www.baidu.com"); echo $snoopy->results;
上記の数行のコードを使用すると、Baidu ページを簡単にクロールできます。
もちろん、投稿フォームを送信する必要がある場合は、submit メソッドを使用してデータを送信できます。
同時に、リクエストヘッダー、対応するヘッダー、および Cookie 関連の操作関数も渡します。これは非常に強力です。
include "Snoopy.class.php"; $snoopy = new Snoopy(); $snoopy->proxy_host = "http://www.baidu.cn"; $snoopy->proxy_port = "80"; $snoopy->agent = "(compatible; MSIE 4.01; MSN 2.5; AOL 4.0; Windows 98)"; $snoopy->referer = "http://www.4wei.cn"; $snoopy->cookies["SessionID"] = '238472834723489'; $snoopy->cookies["favoriteColor"] = "RED"; $snoopy->rawheaders["Pragma"] = "no-cache"; $snoopy->maxredirs = 2; $snoopy->offsiteok = false; $snoopy->expandlinks = false; $snoopy->user = "joe"; $snoopy->pass = "bloe"; if($snoopy->fetchtext("http://www.baidu.cn")) { echo "<pre class="brush:php;toolbar:false">" . htmlspecialchars($snoopy->results) . "\n"; } else { echo "error fetching document: " . $snoopy->error . "\n"; } その他の操作方法については、スヌーピーの公式ドキュメントにアクセスするか、ソースコードを直接参照してください。
この時点では、snoopy はページをクロールして戻すだけです。クロールされたページからデータを抽出したい場合は、あまり役に立ちません。ここで、php が HTML を解析するためのもう 1 つの優れたツールである phpQuery を見つけました。このツールが提供する操作方法は jquery とほぼ同じで、jquery に慣れている子供にとっては非常に簡単に使用できるはずです。 phpquery、さらには phpQuery ドキュメントはもう必要ありません..
Snoopy+PhpQuery を使用すると、Web ページのクローリングとデータ分析を簡単に実現できます。私も最近この分野で必要になり、Java で多くのことができることがわかりました。 . PHP でも同じことができます。
興味のある学生は、これらを使用して簡単な Web クローラーを作成してみることもできます。

PHPでは、特性は方法が必要な状況に適していますが、継承には適していません。 1)特性により、クラスの多重化方法が複数の継承の複雑さを回避できます。 2)特性を使用する場合、メソッドの競合に注意を払う必要があります。メソッドの競合は、代替およびキーワードとして解決できます。 3)パフォーマンスを最適化し、コードメンテナビリティを改善するために、特性の過剰使用を避け、その単一の責任を維持する必要があります。

依存関係噴射コンテナ(DIC)は、PHPプロジェクトで使用するオブジェクト依存関係を管理および提供するツールです。 DICの主な利点には、次のものが含まれます。1。デカップリング、コンポーネントの独立したもの、およびコードの保守とテストが簡単です。 2。柔軟性、依存関係を交換または変更しやすい。 3.テスト可能性、単体テストのために模擬オブジェクトを注入するのに便利です。

SplfixedArrayは、PHPの固定サイズの配列であり、高性能と低いメモリの使用が必要なシナリオに適しています。 1)動的調整によって引き起こされるオーバーヘッドを回避するために、作成時にサイズを指定する必要があります。 2)C言語アレイに基づいて、メモリと高速アクセス速度を直接動作させます。 3)大規模なデータ処理とメモリに敏感な環境に適していますが、サイズが固定されているため、注意して使用する必要があります。

PHPは、$ \ _ファイル変数を介してファイルのアップロードを処理します。セキュリティを確保するための方法には次のものが含まれます。1。アップロードエラー、2。ファイルの種類とサイズを確認する、3。ファイル上書きを防ぐ、4。ファイルを永続的なストレージの場所に移動します。

JavaScriptでは、nullcoalescingoperator(??)およびnullcoalescingsignmentoperator(?? =)を使用できます。 1.??最初の非潜水金または非未定されたオペランドを返します。 2.??これらの演算子は、コードロジックを簡素化し、読みやすさとパフォーマンスを向上させます。

XSS攻撃を防ぎ、リソースのロードを制限し、ウェブサイトのセキュリティを改善できるため、CSPは重要です。 1.CSPはHTTP応答ヘッダーの一部であり、厳格なポリシーを通じて悪意のある行動を制限します。 2。基本的な使用法は、同じ起源からのロードリソースのみを許可することです。 3.高度な使用法は、特定のドメイン名がスクリプトやスタイルをロードできるようにするなど、より微調整された戦略を設定できます。 4。CSPポリシーをデバッグおよび最適化するには、コンテンツセキュリティポリシーレポートのみのヘッダーを使用します。

HTTPリクエストメソッドには、それぞれリソースを取得、送信、更新、削除するために使用されるGET、POST、PUT、および削除が含まれます。 1. GETメソッドは、リソースを取得するために使用され、読み取り操作に適しています。 2. POSTメソッドはデータの送信に使用され、新しいリソースを作成するためによく使用されます。 3. PUTメソッドは、リソースの更新に使用され、完全な更新に適しています。 4.削除メソッドは、リソースの削除に使用され、削除操作に適しています。

HTTPSは、HTTPに基づいてセキュリティレイヤーを追加するプロトコルであり、主に暗号化されたデータを介してユーザーのプライバシーとデータセキュリティを保護します。その作業原則には、TLSの握手、証明書の確認、暗号化された通信が含まれます。 HTTPSを実装する場合、証明書管理、パフォーマンスへの影響、および混合コンテンツの問題に注意を払う必要があります。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

SublimeText3 Linux 新バージョン
SublimeText3 Linux 最新バージョン

MantisBT
Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

SublimeText3 中国語版
中国語版、とても使いやすい

Safe Exam Browser
Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

ホットトピック



