Rumah  >  Soal Jawab  >  teks badan

python - 前端er 想爬数据 从什么入门好?

本人前端一枚

想做一个demo练手,需要得到爬取数据的本领,请问从哪里开始学习呢?

场景:爬取商品价格的数据,得到双十一前后的价格趋势变化,我可以如何入手呢?

我是JavaScript使用者,尽量使用node,如果Python学习成本比较高,求推荐教程和爬取数据的方法

PHP中文网PHP中文网2711 hari yang lalu342

membalas semua(9)saya akan balas

  • 天蓬老师

    天蓬老师2017-04-18 09:58:30

    Syorkan https://github.com/alsotang/n...

    balas
    0
  • PHP中文网

    PHP中文网2017-04-18 09:58:30

    Rantai alat perangkak:

    Gunakan superagent untuk memulakan permintaan http Selepas mendapat respons, gunakan cheerio untuk menghuraikan teks Kemudian anda boleh menggunakan sintaks yang serupa dengan jQuery untuk mengendalikan Dom.

    Mongodb boleh digunakan untuk penyimpanan data, dan mongoose boleh digunakan sebagai alat ORM yang sepadan.

    Contoh kod
    https://github.com/zhanyouwei...

    balas
    0
  • PHP中文网

    PHP中文网2017-04-18 09:58:30

    Bukankah kos pembelajaran Python diketahui paling rendah? ? Mudah untuk bermula dengan perangkak Python Terdapat banyak tutorial dalam talian

    balas
    0
  • PHP中文网

    PHP中文网2017-04-18 09:58:30

    scrapy pasti berada di kedudukan pertama! ! !

    balas
    0
  • 高洛峰

    高洛峰2017-04-18 09:58:30

    Bermula dengan Node dengan tegas, anda boleh merujuk kepada pengalaman baru saya https://github.com/hanzichi/f...

    balas
    0
  • PHP中文网

    PHP中文网2017-04-18 09:58:30

    Kos pembelajaran Python tidak terlalu tinggi, izinkan saya bercakap tentang pengalaman saya
    Pada mulanya saya menggunakan urllib, atau urllib2, dan mendapati bahawa saya sangat teruja untuk merangkak data
    Kemudian saya melihat halaman di mana Sambungan Ditutup , saya belajar tentang httplib2
    dan kemudian melihat permintaan
    dan kini saya melihat scrapy

    Merangkak ialah metafizik Saya rasa matlamat soalan itu bagus untuk menyemak arah aliran harga, tetapi saya rasa kita boleh menetapkan matlamat kecil dahulu dan merangkak Ensiklopedia Baidu~

    balas
    0
  • 迷茫

    迷茫2017-04-18 09:58:30

    Perangkak nod hanya berharga 20

    balas
    0
  • 高洛峰

    高洛峰2017-04-18 09:58:30

    nodej superagent + cheerio

    balas
    0
  • 伊谢尔伦

    伊谢尔伦2017-04-18 09:58:30

    nodejs request + cheerio juga bagus.

    balas
    0
  • Batalbalas