python爬取饿了么-Python教程-PHP中文网

首页

后端开发

Python教程

python爬取饿了么

步履不停

Jul 01, 2019 pm 01:31 PM

python饿了么

python爬取饿了么

在学数据可视化，缺少点数据进行实操，就想着从饿了么上面爬点外卖店信息。

主要是获取数据，所以代码比较简陋，直接上代码：

import requests
import json
import csv
def crawler_ele(page=0):
def get_page(page):
url = &#39;https://h5.ele.me/restapi/shopping/v3/restaurants?latitude=xxxx&longitude=xxxx&offset={page}&limit=8&terminal=h5&#39;.format(page=page*8)
headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.80 Safari/537.36",
    &#39;cookie&#39;: r&#39;xxxx&#39;
}
re = json.loads(requests.get(url,headers=headers).text)
return re
re = get_page(page)
if re.get(&#39;items&#39;):
with open(&#39;data.csv&#39;,&#39;a&#39;,newline=&#39;&#39;) as f:
writer = csv.DictWriter(f,fieldnames=[&#39;名称&#39;, &#39;月销售量&#39;,&#39;配送费&#39;, &#39;起送价&#39;, &#39;风味&#39;,&#39;评分&#39;, &#39;配送时长&#39;, &#39;评分统计&#39;, &#39;距离&#39;, &#39;地址&#39;])
writer.writeheader()
for item in re.get(&#39;items&#39;):
info = dict()
restaurant = item.get(&#39;restaurant&#39;)
info[&#39;地址&#39;] = restaurant.get(&#39;address&#39;)
info[&#39;配送费&#39;] = restaurant.get(&#39;float_delivery_fee&#39;)
info[&#39;名称&#39;] = restaurant.get(&#39;name&#39;)
info[&#39;配送时长&#39;] = restaurant.get(&#39;order_lead_time&#39;)
info[&#39;距离&#39;] = restaurant.get(&#39;distance&#39;)
info[&#39;起送价&#39;] = restaurant.get(&#39;float_minimum_order_amount&#39;)
info[&#39;评分&#39;] = restaurant.get(&#39;rating&#39;)
info[&#39;月销售量&#39;] = restaurant.get(&#39;recent_order_num&#39;)
info[&#39;评分统计&#39;] = restaurant.get(&#39;rating_count&#39;)
info[&#39;风味&#39;] = restaurant.get(&#39;flavors&#39;)[0].get(&#39;name&#39;)
writer.writerow(info) 
# print(info)
if re.get(&#39;has_next&#39;) == True:
crawler_page(page+1)
crawler_ele(0)

在这里简单注释几句：

url 中的经纬度去掉了，可以自行查询添加需要爬取地点的经纬度，也可以通过调用地图api获取经纬度；

headers 需要加 Cookies ，不然会有登录权限限制爬取页数；

最后调用的是递归不是循环，所以保存结果的 csv 文件里面会有多个重复表头，可以用 Excel 打开删除重复值就可以了。

相关教程推荐：Python视频教程

以上是python爬取饿了么的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

Python和时间：充分利用您的学习时间Apr 14, 2025 am 12:02 AM

要在有限的时间内最大化学习Python的效率，可以使用Python的datetime、time和schedule模块。1.datetime模块用于记录和规划学习时间。2.time模块帮助设置学习和休息时间。3.schedule模块自动化安排每周学习任务。

Python：游戏，Guis等Apr 13, 2025 am 12:14 AM

Python在游戏和GUI开发中表现出色。1)游戏开发使用Pygame，提供绘图、音频等功能，适合创建2D游戏。2)GUI开发可选择Tkinter或PyQt，Tkinter简单易用，PyQt功能丰富，适合专业开发。

Python vs.C：申请和用例Apr 12, 2025 am 12:01 AM

Python适合数据科学、Web开发和自动化任务，而C 适用于系统编程、游戏开发和嵌入式系统。 Python以简洁和强大的生态系统着称，C 则以高性能和底层控制能力闻名。

2小时的Python计划：一种现实的方法Apr 11, 2025 am 12:04 AM

2小时内可以学会Python的基本编程概念和技能。1.学习变量和数据类型，2.掌握控制流（条件语句和循环），3.理解函数的定义和使用，4.通过简单示例和代码片段快速上手Python编程。

Python：探索其主要应用程序Apr 10, 2025 am 09:41 AM

Python在web开发、数据科学、机器学习、自动化和脚本编写等领域有广泛应用。1)在web开发中，Django和Flask框架简化了开发过程。2)数据科学和机器学习领域，NumPy、Pandas、Scikit-learn和TensorFlow库提供了强大支持。3)自动化和脚本编写方面，Python适用于自动化测试和系统管理等任务。