ホームページ  >  に質問  >  本文

网页爬虫 - python爬虫案例

请问大家能不能给我一点提点,我想要知道有没有 简单 一点的 爬虫 案例可以让我摸索学习


目前已知的爬虫工具有:

  1. Beautiful Soup

  2. Scrapy

  3. cola

  4. pyspider

  5. PyQuery

  6. grab

ringa_leeringa_lee2742日前1138

全員に返信(1)返信します

  • PHP中文网

    PHP中文网2017-04-17 17:52:11

    本当にわからない場合は、ここに参考情報がいくつかありますが、重要な点は、読んでください...

    まず、ウェブ クローラーとは何ですか:

    1. Wiki-Web クローラーを簡単に見てみることができます

    2. もう一度この Web サイトにアクセスしてください。University Mathematics School には簡単な教え (およびビデオ) があり、初心者には非常に適していると思います。Web クローラーとは何ですか

      <🎜。 >
    次に

    導入チュートリアル:

    1. 実際、文書を読むための非常に簡単な方法があります。指示がない場合は、中国語ではなく、美しいスープ中国語の文書を読むことを選択できます。複雑すぎるので、すべて読むには時間がかかります。

    2. 現在、大学の数学スクールでは一連の入門教育と実践教育が行われています。入門コースの最初のいくつかの記事を以下に挙げます。

      1. Python を使用して Web クローラー (Crawler) を作成し始める

      2. Jupyter (Ipython Notebook) のインストール方法

      3. Jupyter 操作入門 (1)

      4. GET を使用して Web コンテンツをクロールするにはどうすればよいですか?

      5. POST を使用して Web コンテンツをクロールするにはどうすればよいですか?

      6. Python パッケージ: BeautifulSoup4 を使用して Web コンテンツを分析する方法は?

      7. Python リクエストと BeautifulSoup4 を使用して淘宝クローラーを完成させるにはどうすればよいですか?

    次のステップは、

    ツールクローラー フレームワーク を理解することです。

    1. この場所は非常に充実しています: Github コードのダウンロード リンクを含む Python クローラー ツール リスト

    2. このブログにもたくさんの教えがあります

    クローラー ツールとフレームワークについての議論については、この記事を参照してください。 Zhihu: Python でクローラーを作成する場合、どの方法とフレームワークが優れていますか?


    インターネット上にはたくさんのリソースがあると思います。すべて試してみることができます。最初はすべてが難しいので、さあ!

    返事
    0
  • キャンセル返事