Maison  >  Article  >  développement back-end  >  Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?

WBOY
WBOYavant
2023-04-26 15:19:181718parcourir

1. Acquisition de données

Demander un lien vers le site Web

Vérifiez d'abord le China Weather Network Ici, visitez le site Web météo local. Si vous souhaitez explorer différentes régions, modifiez simplement le dernier numéro de zone 101280701. Il s'agit d'une page Web de 7 jours, Weather1d représente le jour en cours et Weather15d représente les 14 prochains jours. Ici, nous visitons principalement le réseau météo chinois de 7 et 14 jours. Utilisez la méthode request.get() pour demander la page Web. Si l'accès réussit, vous obtiendrez toute la chaîne de texte de la page Web. C'est le processus de demande.

def getHTMLtext(url):
"""请求获得网页内容"""
 try:
r = requests.get(url, timeout = 30)
r.raise_for_status()
r.encoding = r.apparent_encoding
print("成功访问")
return r.text
 except:
print("访问错误")
 return" "
Extraire des informations utiles

Ici, nous utilisons la bibliothèque BeautifulSoup pour extraire les données de la chaîne qui vient d'être obtenue. Vérifiez d'abord la page Web et recherchez les balises qui doivent obtenir des données :

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?

Vous pouvez trouver le 7 jours. les informations sur les données dans la balise div et id="7d", et la date, la météo, la température, le niveau du vent et d'autres informations sont toutes dans les balises ul et li, nous pouvons donc utiliser BeautifulSoup pour rechercher l'identifiant de la balise div du texte de la page Web obtenu ="7d" et recherchez toutes les balises ul et li incluses, puis extrayez les valeurs de données correspondantes dans les balises et enregistrez-les dans la liste correspondante.

Un détail à noter ici est que parfois la date n'a pas la température la plus élevée, et la situation sans données doit être jugée et traitée. De plus, certains formats de stockage de données doivent être traités à l'avance, tels que le symbole Celsius derrière la température, l'extraction des numéros de date et l'extraction du texte au niveau du vent. Cela nécessite une recherche de caractères et un traitement de découpage de chaînes.

def get_content(html):
"""处理得到有用信息保存数据文件"""
final = []# 初始化一个列表保存数据
bs = BeautifulSoup(html, "html.parser")# 创建BeautifulSoup对象
body = bs.body
data = body.find('div', {'id': '7d'})# 找到div标签且id = 7d

Ce qui suit explore les données de la journée en cours

data2 = body.find_all('div',{'class':'left-div'})
text = data2[2].find('script').string
text = text[text.index('=')+1 :-2] # 移除改var data=将其变为json数据
jd = json.loads(text)
dayone = jd['od']['od2'] # 找到当天的数据
final_day = [] # 存放当天的数据
count = 0
for i in dayone:
temp = []
if count <=23:
temp.append(i[&#39;od21&#39;]) # 添加时间
temp.append(i[&#39;od22&#39;]) # 添加当前时刻温度
temp.append(i[&#39;od24&#39;]) # 添加当前时刻风力方向
temp.append(i[&#39;od25&#39;]) # 添加当前时刻风级
temp.append(i[&#39;od26&#39;]) # 添加当前时刻降水量
temp.append(i[&#39;od27&#39;]) # 添加当前时刻相对湿度
temp.append(i[&#39;od28&#39;]) # 添加当前时刻控制质量
#print(temp)
final_day.append(temp)
count = count +1

Ce qui suit explore les données de 7 jours

ul = data.find(&#39;ul&#39;)# 找到所有的ul标签
li = ul.find_all(&#39;li&#39;)# 找到左右的li标签
i = 0 # 控制爬取的天数
for day in li:# 遍历找到的每一个li
if i < 7 and i > 0:
temp = []# 临时存放每天的数据
date = day.find(&#39;h2&#39;).string # 得到日期
date = date[0:date.index(&#39;日&#39;)] # 取出日期号
temp.append(date)
inf = day.find_all(&#39;p&#39;)# 找出li下面的p标签,提取第一个p标签的值,即天气
temp.append(inf[0].string)
 tem_low = inf[1].find(&#39;i&#39;).string # 找到最低气温
 if inf[1].find(&#39;span&#39;) is None: # 天气预报可能没有最高气温
 tem_high = None
 else:
 tem_high = inf[1].find(&#39;span&#39;).string# 找到最高气温
 temp.append(tem_low[:-1])
 if tem_high[-1] == &#39;℃&#39;:
temp.append(tem_high[:-1])
 else:
temp.append(tem_high)
 wind = inf[2].find_all(&#39;span&#39;)# 找到风向
 for j in wind:
temp.append(j[&#39;title&#39;])
 wind_scale = inf[2].find(&#39;i&#39;).string # 找到风级
 index1 = wind_scale.index(&#39;级&#39;)
 temp.append(int(wind_scale[index1-1:index1]))
 final.append(temp)
i = i + 1
return final_day,final

Le même processus est effectué pour /weather15d : 15 jours d'informations. Après avoir vérifié ici, il s'avère qu'il y en a. seulement 8 à 14 jours, les 1 à 7 premiers jours sont dans /weather. Ici, nous visitons respectivement deux pages Web et fusionnons les données explorées pour obtenir les 14 derniers jours de données. - Le front est le processus d'exploration des données pour les 14 prochains jours. Pour les données d'informations météorologiques sur 24 heures du jour, après recherche, il s'avère qu'il s'agit de données json. Vous pouvez obtenir les données du jour via le json. .loads(), puis effectuez l'extraction des informations météo du jour.

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?

Enregistrez le fichier csv

Ajoutez les données analysées à la liste plus tôt, introduisez la bibliothèque csv ici, utilisez les méthodes f_csv.writerow(header) et f_csv.writerows(data) pour écrire respectivement l'en-tête et chaque ligne Les données d'un jour et des 14 jours suivants sont stockées séparément et enregistrées respectivement sous Weather1.csv et Weather14.csv. Voici le tableau qu'ils ont enregistré :

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?

2. le graphique de la courbe de changement de température

utilise la méthode plt.plot() dans matplotlib pour tracer la courbe de changement de température sur 24 heures par jour, et utilise la méthode plt.text() pour indiquer les températures maximales et minimales et tracer la moyenne ligne de température. L'image ci-dessous montre le graphique de la courbe de changement de température : (voir l'annexe pour le code)

Génial ! N projets open source indispensables pour entreprendre des travaux privés ! Dépêchez-vous de le récupérer

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?L'analyse peut révéler que la température la plus élevée ce jour-là est de 33 ℃, la température la plus basse est de 28 ℃ et la température moyenne est d'environ 20,4 ℃. Grâce à l'analyse du temps, il s'avère que la température. La différence entre le jour et la nuit est de 5 ℃, avec une basse température distribuée tôt le matin et une température élevée distribuée entre midi et l'après-midi.

Courbe de changement d'humidité relative du jour

Utilisation de la méthode plt.plot() dans matplotlib pour tracer la courbe de changement d'humidité sur 24 heures et tracer la ligne d'humidité relative moyenne L'image suivante est la courbe de changement d'humidité : (voir l'annexe pour le code)

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?L'analyse peut révéler que l'humidité relative la plus élevée ce jour-là est de 86 %, l'humidité relative la plus basse est de 58 ℃ et l'humidité relative moyenne est d'environ 75 %. l'humidité est relativement élevée tôt le matin, tandis que l'humidité est relativement élevée l'après-midi jusqu'au crépuscule.

Tableau d'analyse de la corrélation entre la température et l'humidité

Grâce à l'analyse des deux figures précédentes, nous pouvons sentir qu'il existe une relation entre la température et l'humidité. Afin de ressentir cette relation plus clairement et intuitivement, utilisez la plt.scatter(). La méthode pour diviser la température est l'abscisse et l'humidité est l'ordonnée. Les points à chaque instant sont indiqués dans la figure et le coefficient de corrélation est calculé. La figure suivante est le résultat :

.

L'analyse peut révéler que la température et l'humidité d'une journée ont une forte corrélation. Elles sont négativement corrélées, ce qui signifie qu'elles sont négativement corrélées avec le temps. Une analyse plus approfondie, lorsque la température est plus basse, il y a plus d'humidité dans l'air et. l'humidité est naturellement plus élevée lorsque la température est élevée, l'eau s'évapore, l'air est plus sec et l'humidité est plus faible, ce qui est conforme aux phénomènes climatiques normaux.

Graphique à barres de l'indice de qualité de l'air

L'indice de qualité de l'air AQI est un indice qui décrit quantitativement les conditions de qualité de l'air. Plus la valeur est élevée, plus la pollution de l'air est grave et plus les dommages à la santé humaine sont importants. L'indice de qualité de l'air est généralement divisé en 6 niveaux. Plus le niveau est élevé, plus la pollution est grave. Ce qui suit utilise la méthode plt.bar pour tracer un histogramme de la qualité de l'air 24 heures sur 24, et selon les six niveaux. , l'histogramme correspondant La couleur va également du clair au foncé, ce qui indique également que la pollution augmente progressivement, montrant la situation de pollution de manière plus intuitive. Les indices de qualité de l'air les plus élevés et les plus bas sont également marqués, et l'indice de qualité de l'air moyen est dessiné avec. une ligne pointillée. La figure ci-dessous est le résultat du dessin :

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?

Ce ci-dessus est la carte de contrôle de qualité de Zhuhai dans le sud. On peut voir que l'indice de qualité de l'air le plus élevé se situe également dans la fourchette saine, indiquant que l'air à Zhuhai est très bon. L'analyse peut constater que l'indice de qualité de l'air le plus élevé a atteint 35 ce jour-là, et le plus bas était de seulement 14 et la moyenne est d'environ 25. Vous pouvez également découvrir par le temps que l'air est très bon à Zhuhai. l'air est fondamentalement meilleur tôt le matin (4-9 heures) et la pollution de l'air la plus grave se produit dans l'après-midi, vous pouvez donc généralement sortir pour respirer de l'air frais tôt le matin, lorsque la pollution est minime.

La carte de la qualité de l'air ci-dessous provient d'une ville du nord. Vous pouvez voir que l'environnement ici est bien inférieur à celui de Zhuhai.

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?

Graphique radar de direction et de niveau du vent

Statistiques de l'énergie éolienne et de la direction du vent pour une journée Étant donné que l'énergie éolienne et la direction du vent sont mieux affichées en utilisant les coordonnées polaires, la méthode des coordonnées polaires est utilisée pour afficher l'énergie éolienne. et le tableau de la direction du vent pour la journée. Divisez le cercle en Il est divisé en 8 parties, chaque partie représente une direction du vent et le rayon représente la force moyenne du vent. À mesure que le niveau du vent augmente, la couleur bleue s'approfondit. comme suit :

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?

L'analyse peut révéler que le vent du sud-ouest est le plus venteux ce jour-là, et le niveau de vent moyen Il a atteint le niveau 1,75, avec une petite partie des vents du nord-est atteignant le niveau 1,0, et aucun vent provenant d'autres directions vierges.

Graphique des courbes de changement de température haute et basse pour les 14 prochains jours

Statistiques des changements de température haute et basse pour les 14 prochains jours, et tracez leurs courbes de changement, respectivement, en utilisant des lignes pointillées pour tracer leurs lignes de température moyenne. les résultats finaux sont les suivants :

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?

L'analyse peut révéler que la température moyenne élevée au cours des 14 prochains jours est de 30,5 ℃. La température est encore relativement élevée, mais il y aura un refroidissement le 8ème jour dans le futur. Il faut se préparer au refroidissement. La température basse suit une tendance stable et commencera à diminuer le 8ème jour. La température élevée a également baissé, la température globale a baissé et la température basse s'est établie en moyenne autour de 27°C.

Graphique radar de direction et de niveau du vent pour les 14 prochains jours

Statise la direction du vent et la force moyenne du vent pour les 14 prochains jours, et utilise les coordonnées polaires comme auparavant, divisant le cercle en 8 parties, représentant 8 directions. la couleur, le niveau du vent. Plus le résultat final est le suivant :

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?

L'analyse peut constater que les principales directions des vents du sud-est et du sud-ouest au cours des 14 prochains jours, le niveau de vent le plus élevé atteint le niveau 5, et le niveau moyen de vent d'ouest le plus bas est le niveau 3.

Graphique circulaire de répartition du climat pour les 14 prochains jours

Statise le climat pour les 14 prochains jours et trouve le nombre total de jours pour chaque climat. Enfin, dessinez le diagramme circulaire pour chaque climat. Les résultats sont les suivants :

.

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?

L'analyse peut être trouvée Le climat dans les 14 prochains jours sera essentiellement "pluie", "couvert à pluie" et "averses". En combinaison avec le tableau de répartition des températures précédent, nous pouvons. voyez que la température baissera les 8ème et 9ème jours. On peut en déduire qu'il pleuvra ce jour-là. La pluie fait baisser les températures.

3. Conclusion

1. Premièrement, sur la base de l'analyse des données de température et d'humidité explorées, la température varie de basse le matin à élevée à midi, puis basse la nuit. Les tendances de l'humidité et de la température sont opposées. Grâce au coefficient de corrélation, on constate que la température et l'humidité ont une forte corrélation. Après avoir examiné les données, il a été constaté qu'à mesure que la température augmente, l'évaporation de la vapeur d'eau s'intensifie et l'humidité de l'air s'intensifie. diminue et l’humidité diminue. Bien entendu, l’humidité est affectée à la fois par la pression atmosphérique et par la pluie, et l’humidité augmente considérablement lorsqu’il pleut.

2.经查阅资料空气质量不仅跟工厂、汽车等排放的烟气、废气等有关,更为重要的是与气象因素有关。由于昼夜温差明显变化,当地面温度高于高空温度时,空气上升,污染物易被带到高空扩散;当地面温度低于一定高度的温度时,天空形成逆温层,它像一个大盖子一样压在地面上空,使地表空气中各种污染物不易扩散。一般在晚间和清晨影响较大,而当太阳出来后,地面迅速升温,逆温层就会逐渐消散,于是污染空气也就扩散了。

3.风是由气压在水平方向分布的不均匀导致的。风受大气环流、地形、水域等不同因素的综合影响,表现形式多种多样,如季风、地方性的海陆风、山谷风等,一天的风向也有不同的变化,根据未来14天的风向雷达图可以发现未来所有风向基本都有涉及,并且没有特别的某个风向,原因可能是近期没有降水和气文变化不大,导致风向也没有太大的变化规律。

4.天气是指某一个地区距离地表较近的大气层在短时间内的具体状态。跟某瞬时内大气中各种气象要素分布的综合表现。根据未来14天的天气和温度变化可以大致推断出某个时间的气候,天气和温度之间也是有联系的。

4、代码框架

代码主要分为weather.py:对中国天气网进行爬取天气数据并保存csv文件;data1_analysis.py:对当天的天气信息进行可视化处理;data14_analysis.py:对未来14天的天气信息进行可视化处理。下面是代码的结构图:

Quelle est la méthode d’exploration des données météorologiques et d’analyse visuelle en Python ?

附源代码

weather.py

# weather.py
import requests
from bs4 import BeautifulSoup
import csv
import json
def getHTMLtext(url):
"""请求获得网页内容"""
 try:
r = requests.get(url, timeout = 30)
r.raise_for_status()
r.encoding = r.apparent_encoding
print("成功访问")
return r.text
 except:
print("访问错误")
return" "
def get_content(html):
"""处理得到有用信息保存数据文件"""
final = []# 初始化一个列表保存数据
bs = BeautifulSoup(html, "html.parser")# 创建BeautifulSoup对象
body = bs.body
data = body.find(&#39;div&#39;, {&#39;id&#39;: &#39;7d&#39;})# 找到div标签且id = 7d
# 下面爬取当天的数据
data2 = body.find_all('div',{'class':'left-div'})
text = data2[2].find('script').string
text = text[text.index('=')+1 :-2] # 移除改var data=将其变为json数据
jd = json.loads(text)
dayone = jd['od']['od2'] # 找到当天的数据
final_day = [] # 存放当天的数据
count = 0
for i in dayone:
 temp = []
 if count <=23:
temp.append(i['od21']) # 添加时间
temp.append(i['od22']) # 添加当前时刻温度
temp.append(i['od24']) # 添加当前时刻风力方向
temp.append(i['od25']) # 添加当前时刻风级
temp.append(i['od26']) # 添加当前时刻降水量
temp.append(i['od27']) # 添加当前时刻相对湿度
temp.append(i['od28']) # 添加当前时刻控制质量
#print(temp)
final_day.append(temp)
 count = count +1
 # 下面爬取7天的数据
ul = data.find('ul')# 找到所有的ul标签
li = ul.find_all('li')# 找到左右的li标签
i = 0 # 控制爬取的天数
for day in li:# 遍历找到的每一个li
if i < 7 and i > 0:
temp = []# 临时存放每天的数据
date = day.find('h2').string # 得到日期
date = date[0:date.index('日')] # 取出日期号
temp.append(date)
inf = day.find_all('p')# 找出li下面的p标签,提取第一个p标签的值,即天气
temp.append(inf[0].string)
tem_low = inf[1].find('i').string # 找到最低气温
if inf[1].find('span') is None: # 天气预报可能没有最高气温
tem_high = None
else:
tem_high = inf[1].find('span').string# 找到最高气温
temp.append(tem_low[:-1])
if tem_high[-1] == '℃':
 temp.append(tem_high[:-1])
else:
 temp.append(tem_high)
wind = inf[2].find_all('span')# 找到风向
for j in wind:
 temp.append(j['title'])
wind_scale = inf[2].find('i').string # 找到风级
index1 = wind_scale.index('级')
temp.append(int(wind_scale[index1-1:index1]))
final.append(temp)
i = i + 1
return final_day,final
#print(final)
def get_content2(html):
"""处理得到有用信息保存数据文件"""
final = []# 初始化一个列表保存数据
bs = BeautifulSoup(html, "html.parser")# 创建BeautifulSoup对象
body = bs.body
data = body.find('div', {'id': '15d'})# 找到div标签且id = 15d
ul = data.find('ul')# 找到所有的ul标签
li = ul.find_all('li')# 找到左右的li标签
final = []
i = 0 # 控制爬取的天数
for day in li: # 遍历找到的每一个li
if i < 8:
temp = [] # 临时存放每天的数据
date = day.find('span',{'class':'time'}).string# 得到日期
date = date[date.index('(')+1:-2]# 取出日期号
temp.append(date)
weather = day.find('span',{'class':'wea'}).string# 找到天气
temp.append(weather)
tem = day.find('span',{'class':'tem'}).text# 找到温度
temp.append(tem[tem.index('/')+1:-1]) # 找到最低气温
temp.append(tem[:tem.index('/')-1])# 找到最高气温
wind = day.find('span',{'class':'wind'}).string# 找到风向
if '转' in wind: # 如果有风向变化
 temp.append(wind[:wind.index('转')])
 temp.append(wind[wind.index('转')+1:])
else: # 如果没有风向变化,前后风向一致
 temp.append(wind)
 temp.append(wind)
wind_scale = day.find('span',{'class':'wind1'}).string# 找到风级
index1 = wind_scale.index('级')
temp.append(int(wind_scale[index1-1:index1]))
final.append(temp)
return final
def write_to_csv(file_name, data, day=14):
"""保存为csv文件"""
with open(file_name, 'a', errors='ignore', newline='') as f:
 if day == 14:
header = ['日期','天气','最低气温','最高气温','风向1','风向2','风级']
 else:
header = ['小时','温度','风力方向','风级','降水量','相对湿度','空气质量']
 f_csv = csv.writer(f)
 f_csv.writerow(header)
 f_csv.writerows(data)
def main():
"""主函数"""
print("Weather test")
# 珠海
url1 = 'http://www.weather.com.cn/weather/101280701.shtml'# 7天天气中国天气网
url2 = 'http://www.weather.com.cn/weather15d/101280701.shtml' # 8-15天天气中国天气网
html1 = getHTMLtext(url1)
data1, data1_7 = get_content(html1)# 获得1-7天和当天的数据
html2 = getHTMLtext(url2)
data8_14 = get_content2(html2) # 获得8-14天数据
data14 = data1_7 + data8_14
#print(data)
write_to_csv('weather14.csv',data14,14) # 保存为csv文件
write_to_csv('weather1.csv',data1,1)
if __name__ == '__main__':
main()

data1_analysis.py:

# data1_analysis.py
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import math
def tem_curve(data):
"""温度曲线绘制"""
hour = list(data[&#39;小时&#39;])
tem = list(data[&#39;温度&#39;])
for i in range(0,24):
 if math.isnan(tem[i]) == True:
tem[i] = tem[i-1]
 tem_ave = sum(tem)/24 # 求平均温度
tem_max = max(tem)
tem_max_hour = hour[tem.index(tem_max)] # 求最高温度
tem_min = min(tem)
tem_min_hour = hour[tem.index(tem_min)] # 求最低温度
x = []
y = []
for i in range(0, 24):
 x.append(i)
 y.append(tem[hour.index(i)])
plt.figure(1)
plt.plot(x,y,color=&#39;red&#39;,label=&#39;温度&#39;) # 画出温度曲线
plt.scatter(x,y,color=&#39;red&#39;) # 点出每个时刻的温度点
plt.plot([0, 24], [tem_ave, tem_ave], c=&#39;blue&#39;, linestyle=&#39;--&#39;,label=&#39;平均温度&#39;)# 画出平均温度虚线
plt.text(tem_max_hour+0.15, tem_max+0.15, str(tem_max), ha=&#39;center&#39;, va=&#39;bottom&#39;, fontsize=10.5)# 标出最高温度
plt.text(tem_min_hour+0.15, tem_min+0.15, str(tem_min), ha=&#39;center&#39;, va=&#39;bottom&#39;, fontsize=10.5)# 标出最低温度
plt.xticks(x)
plt.legend()
plt.title(&#39;一天温度变化曲线图&#39;)
plt.xlabel(&#39;时间/h&#39;)
plt.ylabel(&#39;摄氏度/℃&#39;)
plt.show()
def hum_curve(data):
"""相对湿度曲线绘制"""
hour = list(data[&#39;小时&#39;])
hum = list(data[&#39;相对湿度&#39;])
for i in range(0,24):
 if math.isnan(hum[i]) == True:
hum[i] = hum[i-1]
 hum_ave = sum(hum)/24 # 求平均相对湿度
hum_max = max(hum)
hum_max_hour = hour[hum.index(hum_max)] # 求最高相对湿度
hum_min = min(hum)
hum_min_hour = hour[hum.index(hum_min)] # 求最低相对湿度
x = []
y = []
for i in range(0, 24):
 x.append(i)
 y.append(hum[hour.index(i)])
plt.figure(2)
plt.plot(x,y,color=&#39;blue&#39;,label=&#39;相对湿度&#39;) # 画出相对湿度曲线
plt.scatter(x,y,color=&#39;blue&#39;) # 点出每个时刻的相对湿度
plt.plot([0, 24], [hum_ave, hum_ave], c=&#39;red&#39;, linestyle=&#39;--&#39;,label=&#39;平均相对湿度&#39;)# 画出平均相对湿度虚线
plt.text(hum_max_hour+0.15, hum_max+0.15, str(hum_max), ha=&#39;center&#39;, va=&#39;bottom&#39;, fontsize=10.5)# 标出最高相对湿度
plt.text(hum_min_hour+0.15, hum_min+0.15, str(hum_min), ha=&#39;center&#39;, va=&#39;bottom&#39;, fontsize=10.5)# 标出最低相对湿度
plt.xticks(x)
plt.legend()
plt.title(&#39;一天相对湿度变化曲线图&#39;)
plt.xlabel(&#39;时间/h&#39;)
plt.ylabel(&#39;百分比/%&#39;)
plt.show()
def air_curve(data):
"""空气质量曲线绘制"""
hour = list(data[&#39;小时&#39;])
air = list(data[&#39;空气质量&#39;])
print(type(air[0]))
for i in range(0,24):
 if math.isnan(air[i]) == True:
air[i] = air[i-1]
 air_ave = sum(air)/24 # 求平均空气质量
air_max = max(air)
air_max_hour = hour[air.index(air_max)] # 求最高空气质量
air_min = min(air)
air_min_hour = hour[air.index(air_min)] # 求最低空气质量
x = []
y = []
for i in range(0, 24):
 x.append(i)
 y.append(air[hour.index(i)])
plt.figure(3)

for i in range(0,24):
 if y[i] <= 50:
plt.bar(x[i],y[i],color=&#39;lightgreen&#39;,width=0.7)# 1等级
 elif y[i] <= 100:
plt.bar(x[i],y[i],color=&#39;wheat&#39;,width=0.7) # 2等级
 elif y[i] <= 150:
plt.bar(x[i],y[i],color=&#39;orange&#39;,width=0.7) # 3等级
 elif y[i] <= 200:
plt.bar(x[i],y[i],color=&#39;orangered&#39;,width=0.7)# 4等级
 elif y[i]  300:
plt.bar(x[i],y[i],color=&#39;maroon&#39;,width=0.7) # 6等级
plt.plot([0, 24], [air_ave, air_ave], c=&#39;black&#39;, linestyle=&#39;--&#39;)# 画出平均空气质量虚线
plt.text(air_max_hour+0.15, air_max+0.15, str(air_max), ha=&#39;center&#39;, va=&#39;bottom&#39;, fontsize=10.5)# 标出最高空气质量
plt.text(air_min_hour+0.15, air_min+0.15, str(air_min), ha=&#39;center&#39;, va=&#39;bottom&#39;, fontsize=10.5)# 标出最低空气质量
plt.xticks(x)
plt.title(&#39;一天空气质量变化曲线图&#39;)
plt.xlabel(&#39;时间/h&#39;)
plt.ylabel(&#39;空气质量指数AQI&#39;)
plt.show()
def wind_radar(data):
"""风向雷达图"""
wind = list(data[&#39;风力方向&#39;])
wind_speed = list(data[&#39;风级&#39;])
for i in range(0,24):
 if wind[i] == "北风":
wind[i] = 90
 elif wind[i] == "南风":
wind[i] = 270
 elif wind[i] == "西风":
wind[i] = 180
 elif wind[i] == "东风":
wind[i] = 360
 elif wind[i] == "东北风":
wind[i] = 45
 elif wind[i] == "西北风":
wind[i] = 135
 elif wind[i] == "西南风":
wind[i] = 225
 elif wind[i] == "东南风":
wind[i] = 315
degs = np.arange(45,361,45)
temp = []
for deg in degs:
 speed = []
 # 获取 wind_deg 在指定范围的风速平均值数据
 for i in range(0,24):
if wind[i] == deg:
 speed.append(wind_speed[i])
 if len(speed) == 0:
temp.append(0)
 else:
temp.append(sum(speed)/len(speed))
print(temp)
N = 8
theta = np.arange(0.+np.pi/8,2*np.pi+np.pi/8,2*np.pi/8)
# 数据极径
radii = np.array(temp)
# 绘制极区图坐标系
plt.axes(polar=True)
# 定义每个扇区的RGB值(R,G,B),x越大,对应的颜色越接近蓝色
colors = [(1-x/max(temp), 1-x/max(temp),0.6) for x in radii]
plt.bar(theta,radii,width=(2*np.pi/N),bottom=0.0,color=colors)
plt.title(&#39;一天风级图&#39;,x=0.2,fontsize=20)
plt.show()
def calc_corr(a, b):
"""计算相关系数"""
a_avg = sum(a)/len(a)
b_avg = sum(b)/len(b)
cov_ab = sum([(x - a_avg)*(y - b_avg) for x,y in zip(a, b)])
 sq = math.sqrt(sum([(x - a_avg)**2 for x in a])*sum([(x - b_avg)**2 for x in b]))
corr_factor = cov_ab/sq
return corr_factor
def corr_tem_hum(data):
"""温湿度相关性分析"""
tem = data[&#39;温度&#39;]
hum = data[&#39;相对湿度&#39;]
plt.scatter(tem,hum,color=&#39;blue&#39;)
plt.title("温湿度相关性分析图")
plt.xlabel("温度/℃")
plt.ylabel("相对湿度/%")
plt.text(20,40,"相关系数为:"+str(calc_corr(tem,hum)),fontdict={&#39;size&#39;:&#39;10&#39;,&#39;color&#39;:&#39;red&#39;})
plt.show()
print("相关系数为:"+str(calc_corr(tem,hum)))
def main():
plt.rcParams[&#39;font.sans-serif&#39;]=[&#39;SimHei&#39;] # 解决中文显示问题
plt.rcParams[&#39;axes.unicode_minus&#39;] = False# 解决负号显示问题
data1 = pd.read_csv(&#39;weather1.csv&#39;,encoding=&#39;gb2312&#39;)
print(data1)
tem_curve(data1)
hum_curve(data1)
air_curve(data1)
wind_radar(data1)
corr_tem_hum(data1)
if __name__ == &#39;__main__&#39;:
main()
data14_analysis.py:
# data14_analysis.py
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import math
def tem_curve(data):
"""温度曲线绘制"""
date = list(data[&#39;日期&#39;])
tem_low = list(data[&#39;最低气温&#39;])
tem_high = list(data[&#39;最高气温&#39;])
for i in range(0,14):
 if math.isnan(tem_low[i]) == True:
tem_low[i] = tem_low[i-1]
 if math.isnan(tem_high[i]) == True:
tem_high[i] = tem_high[i-1]
 tem_high_ave = sum(tem_high)/14 # 求平均高温
 tem_low_ave = sum(tem_low)/14 # 求平均低温

tem_max = max(tem_high)
tem_max_date = tem_high.index(tem_max) # 求最高温度
tem_min = min(tem_low)
tem_min_date = tem_low.index(tem_min) # 求最低温度
x = range(1,15)
plt.figure(1)
plt.plot(x,tem_high,color=&#39;red&#39;,label=&#39;高温&#39;)# 画出高温度曲线
plt.scatter(x,tem_high,color=&#39;red&#39;) # 点出每个时刻的温度点
plt.plot(x,tem_low,color=&#39;blue&#39;,label=&#39;低温&#39;)# 画出低温度曲线
plt.scatter(x,tem_low,color=&#39;blue&#39;) # 点出每个时刻的温度点

plt.plot([1, 15], [tem_high_ave, tem_high_ave], c=&#39;black&#39;, linestyle=&#39;--&#39;)# 画出平均温度虚线
plt.plot([1, 15], [tem_low_ave, tem_low_ave], c=&#39;black&#39;, linestyle=&#39;--&#39;)# 画出平均温度虚线
plt.legend()
plt.text(tem_max_date+0.15, tem_max+0.15, str(tem_max), ha=&#39;center&#39;, va=&#39;bottom&#39;, fontsize=10.5)# 标出最高温度
plt.text(tem_min_date+0.15, tem_min+0.15, str(tem_min), ha=&#39;center&#39;, va=&#39;bottom&#39;, fontsize=10.5)# 标出最低温度
plt.xticks(x)
plt.title(&#39;未来14天高温低温变化曲线图&#39;)
plt.xlabel(&#39;未来天数/天&#39;)
plt.ylabel(&#39;摄氏度/℃&#39;)
plt.show()
def change_wind(wind):
"""改变风向"""
for i in range(0,14):
 if wind[i] == "北风":
wind[i] = 90
 elif wind[i] == "南风":
wind[i] = 270
 elif wind[i] == "西风":
wind[i] = 180
 elif wind[i] == "东风":
wind[i] = 360
 elif wind[i] == "东北风":
wind[i] = 45
 elif wind[i] == "西北风":
wind[i] = 135
 elif wind[i] == "西南风":
wind[i] = 225
 elif wind[i] == "东南风":
wind[i] = 315
return wind
def wind_radar(data):
"""风向雷达图"""
wind1 = list(data[&#39;风向1&#39;])
wind2 = list(data[&#39;风向2&#39;])
wind_speed = list(data[&#39;风级&#39;])
wind1 = change_wind(wind1)
wind2 = change_wind(wind2)

degs = np.arange(45,361,45)
temp = []
for deg in degs:
 speed = []
 # 获取 wind_deg 在指定范围的风速平均值数据
 for i in range(0,14):
if wind1[i] == deg:
 speed.append(wind_speed[i])
if wind2[i] == deg:
 speed.append(wind_speed[i])
 if len(speed) == 0:
temp.append(0)
 else:
temp.append(sum(speed)/len(speed))
print(temp)
N = 8
theta = np.arange(0.+np.pi/8,2*np.pi+np.pi/8,2*np.pi/8)
# 数据极径
radii = np.array(temp)
# 绘制极区图坐标系
plt.axes(polar=True)
# 定义每个扇区的RGB值(R,G,B),x越大,对应的颜色越接近蓝色
colors = [(1-x/max(temp), 1-x/max(temp),0.6) for x in radii]
plt.bar(theta,radii,width=(2*np.pi/N),bottom=0.0,color=colors)
plt.title(&#39;未来14天风级图&#39;,x=0.2,fontsize=20)
plt.show()
def weather_pie(data):
"""绘制天气饼图"""
weather = list(data[&#39;天气&#39;])
dic_wea = { }
for i in range(0,14):
 if weather[i] in dic_wea.keys():
dic_wea[weather[i]] += 1
 else:
dic_wea[weather[i]] = 1
print(dic_wea)
explode=[0.01]*len(dic_wea.keys())
color = [&#39;lightskyblue&#39;,&#39;silver&#39;,&#39;yellow&#39;,&#39;salmon&#39;,&#39;grey&#39;,&#39;lime&#39;,&#39;gold&#39;,&#39;red&#39;,&#39;green&#39;,&#39;pink&#39;]
plt.pie(dic_wea.values(),explode=explode,labels=dic_wea.keys(),autopct=&#39;%1.1f%%&#39;,colors=color)
plt.title(&#39;未来14天气候分布饼图&#39;)
plt.show()
def main():
plt.rcParams[&#39;font.sans-serif&#39;]=[&#39;SimHei&#39;] # 解决中文显示问题
plt.rcParams[&#39;axes.unicode_minus&#39;] = False# 解决负号显示问题
data14 = pd.read_csv(&#39;weather14.csv&#39;,encoding=&#39;gb2312&#39;)
print(data14)
tem_curve(data14)
wind_radar(data14)
weather_pie(data14)
if __name__ == &#39;__main__&#39;:
main()

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer