首頁  >  問答  >  主體

python - 如何爬取百度指数的数据?

百度指数的查询地址:http://index.baidu.com
比如说我输入:世界杯。查询到的结果如下:

查询到的结果数字并不是文本的形式,不知道应该如何抓取?

希望各位大神指教!

怪我咯怪我咯2741 天前1336

全部回覆(7)我來回復

  • 迷茫

    迷茫2017-04-17 13:50:16

    ajax的吧 看看ajax裡的請求回傳資料吧

    回覆
    0
  • 迷茫

    迷茫2017-04-17 13:50:16

    F12 ,妥妥的
    找 http://index.baidu.com/Interface/Search/getAllIndex/?res=azsWJCcMfgQgYQUpI2wmSz0GawFcHjoMKyIkMG0eYFYDXUspVARdQi03DiU6elRIMR0sRTIkMG0eYFYDXUspVARdQi03DiU6elRIMR0sRT18IElxMRTIsp EwGgMIc10aWUdVIwxREhNfZxs4PjE7Ag9eMG0PZDEQczUlA153HSY5CmNDaDRDaXMIeRhIMi5rN1YQVwoyBCVGQXZGJxAhdKJBhVH0pwJBVHFFyFFyFyFyFyFxFxY4x4x454x4x4500c CKQ%3D%3D&res2=iMdY1W1TGQHmpyG9tZta9KatZf2VFnf1sQab3vylcHnlz95IvL491.2RTSXE73&startdate=2014-05-28&enddate=2014-06-26<

    回覆
    0
  • ringa_lee

    ringa_lee2017-04-17 13:50:16

    大致步驟如下:

    1. 首先要前往這個頁面登錄,取得會話 cookie;
    2. 然後使用取得到的 cookie 存取指數查詢的 URL(此處使用「google io」):http://index.baidu.com/?tpl=trend&word=google+io
    3. 根據取得到頁面中的 Javascript,拼接相關 AJAX 請求 URL,使用取得到的 cookie 重新要求該 URL,傳回的內容就是你要的東西。

    可能需要用到的第三方函式庫:

    • BeautifulSoup
    • scrapy

    回覆
    0
  • PHP中文网

    PHP中文网2017-04-17 13:50:16

    百度加密了,很難抓取的。
    在淘寶上看到了一家店。 。 。 http://t.cn/RhC1O6J

    回覆
    0
  • 黄舟

    黄舟2017-04-17 13:50:16

    我們提供百度指數的即時抓取服務,請造訪我們的線上demo網站:http://www.datadriver.info/scrapdata/,
    我們可以免費分享詳細的破解過程和演算法描述,但不提供原始碼。 您也可以qq我們,2011193471

    回覆
    0
  • 大家讲道理

    大家讲道理2017-04-17 13:50:16

    https://item.taobao.com/item.htm?id=42837426371

    回覆
    0
  • 怪我咯

    怪我咯2017-04-17 13:50:16

    http://www.jianshu.com/p/361c97b4428a 免費

    回覆
    0
  • 取消回覆