この記事では主にPHPがWebページを巡回してHTMLを解析するためによく使われる方法のまとめを紹介しています この記事ではこれらを実現できる方法のみをまとめています。実装方法ではなく方法を紹介しますので、困っている友達は参考にしてください
概要
クローラーはプログラムを作るときによく遭遇する機能です。 PHP には、snoopy などのオープン ソース クローラー ツールが多数あります。これらのオープン ソース クローラー ツールは、通常、ほとんどの機能を実行するのに役立ちますが、場合によっては、クローラーを自分で実装する必要があります。この記事では、PHP でクローラーを実装する方法について説明します。まとめ。
PHPでクローラを実装する主な方法
1.file()関数
2.file_get_contents()関数
3.fopen()->fread()->fclose()メソッド
4.カール法
5.fsockopen()関数、ソケットメソッド
6. スヌーピーなどのオープンソースツールを使用する
PHP が XML または HTML を解析する主な方法
1.正規表現
2.PHP DOMDocumentオブジェクト
3. PHP Simple HTML DOM Parser などのプラグイン
概要
ここでは、PHP がクローラーを実装する方法について簡単にまとめます。この設計にはさらに多くの内容があります。後で、PHP が HTML と XML を解析する方法についてまとめます。