助けてください! ページのコンテンツを収集する問題について
ページ http://www.meishichina.com/Topic/CaiXi/XiangCai/ のリンクと写真を収集したいのですが、料理を取得するための規則をどのように記述すればよいですか。名前、リンク、画像アドレス?長い間この問題を解決しようとしてきましたが、何も解決しませんでした。誰か兄さんに感謝の意を表したいと思います。
-----解決策--------------------------------ダウンロードは成功しましたか?
ファイルをダウンロードするには、file_get_contents を使用するのが最も簡単です。ただし、ネットワークが良好でない場合は、この関数は機能しません。それ以外の場合は、curl
を使用してください。
コンテンツを取得する最後の方法は、strpos を使用して特殊な漢字を検索し、範囲を狭めた後に通常のルールを使用することです。
長いコンテンツ、特に HTML の場合、正規表現
を使用するのは簡単ではありません。