Heim  >  Artikel  >  Backend-Entwicklung  >  Tipps und Methoden zur Datenvisualisierung und explorativen Datenanalyse mit Pandas

Tipps und Methoden zur Datenvisualisierung und explorativen Datenanalyse mit Pandas

WBOY
WBOYOriginal
2024-01-13 15:40:171363Durchsuche

Tipps und Methoden zur Datenvisualisierung und explorativen Datenanalyse mit Pandas

So verwenden Sie Pandas für die Datenvisualisierung und explorative Analyse

Einführung:
Im Prozess der Datenanalyse sind Visualisierung und explorative Analyse unverzichtbare Verbindungen. Pandas ist eine sehr leistungsstarke Datenanalysebibliothek in Python. Zusätzlich zu den Datenverarbeitungsfunktionen bietet sie auch eine Reihe von Tools zur Datenvisualisierung und explorativen Analyse. In diesem Artikel wird die Verwendung von Pandas zur Datenvisualisierung und explorativen Analyse vorgestellt und spezifische Codebeispiele gegeben.

1. Datenvisualisierung
1. Liniendiagramm ist eine häufig verwendete Datenvisualisierungsmethode, mit der der Trend von Datenänderungen im Zeitverlauf dargestellt werden kann. Das Zeichnen eines Liniendiagramms mit Pandas ist sehr einfach. Rufen Sie einfach die Plot-Methode von DataFrame auf. Hier ist ein Beispielcode:

import pandas as pd

# 创建一个DataFrame
data = {'日期': ['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-04'],
        '销售额': [100, 200, 150, 180]}
df = pd.DataFrame(data)

# 将日期列转换成日期类型
df['日期'] = pd.to_datetime(df['日期'])

# 设置日期列为索引
df.set_index('日期', inplace=True)

# 绘制折线图
df.plot()

2. Histogramm

Das Histogramm ist eine gängige Visualisierungsmethode zum Vergleich verschiedener Datenkategorien. Ebenso ist es sehr einfach, mit Pandas ein Histogramm zu zeichnen. Sie müssen lediglich die Plot-Methode von DataFrame aufrufen und den Art-Parameter auf „bar“ setzen. Hier ist ein Beispielcode:

import pandas as pd

# 创建一个DataFrame
data = {'城市': ['北京', '上海', '广州', '深圳'],
        '人口': [2152, 2424, 1348, 1303]}
df = pd.DataFrame(data)

# 设置城市列为索引
df.set_index('城市', inplace=True)

# 绘制柱状图
df.plot(kind='bar')

3. Streudiagramme

Streudiagramme werden häufig verwendet, um die Korrelation zwischen zwei numerischen Variablen darzustellen. Pandas bietet auch die Funktion, Streudiagramme zu zeichnen. Das Folgende ist ein Beispielcode:

import pandas as pd

# 创建一个DataFrame
data = {'体重': [65, 75, 58, 80, 68],
        '身高': [175, 180, 160, 190, 170]}
df = pd.DataFrame(data)

# 绘制散点图
df.plot.scatter(x='身高', y='体重')

2. Explorative Analyse

1. Grundlegende statistische Analyse
pandas bietet eine Reihe von Methoden für grundlegende statistische Analysen, wie Mittelwert, Median, Minimum, Maximum usw. Das Folgende ist ein Beispielcode:

import pandas as pd

# 创建一个DataFrame
data = {'姓名': ['张三', '李四', '王五', '赵六'],
        '年龄': [18, 20, 22, 24],
        '身高': [170, 175, 180, 185]}
df = pd.DataFrame(data)

# 输出年龄的平均值、中位数、最小值、最大值等统计量
print('平均年龄:', df['年龄'].mean())
print('年龄中位数:', df['年龄'].median())
print('最小年龄:', df['年龄'].min())
print('最大年龄:', df['年龄'].max())

2. Korrelationsanalyse

Zu den gängigen Methoden gehören Korrelationskoeffizient und Kovarianz. Das Folgende ist ein Beispielcode:

import pandas as pd

# 创建一个DataFrame
data = {'体重': [65, 75, 58, 80, 68],
        '身高': [175, 180, 160, 190, 170]}
df = pd.DataFrame(data)

# 计算体重和身高的相关系数和协方差
print('相关系数:', df['体重'].corr(df['身高']))
print('协方差:', df['体重'].cov(df['身高']))

3. Pandas bietet eine Reihe von Methoden zur Verarbeitung fehlender Werte, wie z. B. isnull, fillna, dropna usw. Das Folgende ist ein Beispielcode:

import pandas as pd
import numpy as np

# 创建一个包含缺失值的DataFrame
data = {'姓名': ['张三', '李四', np.nan, '赵六'],
        '年龄': [18, 20, np.nan, 24]}
df = pd.DataFrame(data)

# 判断哪些值是缺失值
print(df.isnull())

# 填充缺失值
df.fillna(0, inplace=True)

# 删除包含缺失值的行
df.dropna(inplace=True)

Dieser Artikel stellt die Verwendung von Pandas zur Datenvisualisierung und explorativen Analyse vor und enthält spezifische Codebeispiele. Durch die Beherrschung dieser Fähigkeiten können Sie Daten flexibler verarbeiten, Daten analysieren und aussagekräftige Schlussfolgerungen ziehen.

Das obige ist der detaillierte Inhalt vonTipps und Methoden zur Datenvisualisierung und explorativen Datenanalyse mit Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn