Heim >Backend-Entwicklung >Python-Tutorial >So verwenden Sie das Pandas-Modul für die Datenanalyse in Python 2.x
So verwenden Sie das Pandas-Modul für die Datenanalyse in Python 2.x
Übersicht:
Im Prozess der Datenanalyse und Datenverarbeitung ist Pandas eine sehr leistungsstarke und häufig verwendete Python-Bibliothek. Es bietet Datenstrukturen und Datenanalysetools für eine schnelle und effiziente Datenverarbeitung und -analyse. In diesem Artikel wird die Verwendung von Pandas für die Datenanalyse in Python 2.x vorgestellt und den Lesern einige Codebeispiele zur Verfügung gestellt.
Pandas installieren:
Bevor Sie beginnen, müssen Sie zunächst die Pandas-Bibliothek installieren. Sie können zur Installation den folgenden Befehl über das Terminal oder die Eingabeaufforderung eingeben:
pip install pandas
Datenstruktur:
pandas bietet zwei Hauptdatenstrukturen: 1) Serie 2) DataFrame.
Series ist eine indizierte eindimensionale Array-Struktur, ähnlich einer Spalte in Excel. Codebeispiel:
import pandas as pd # 创建一个Series对象 data = pd.Series([1, 3, 5, np.nan, 6, 8]) print(data)
Ausgabeergebnis:
0 1.0 1 3.0 2 5.0 3 NaN 4 6.0 5 8.0 dtype: float64
DataFrame ist eine zweidimensionale Tabellenstruktur, ähnlich einer Tabelle in Excel. Codebeispiel:
import pandas as pd import numpy as np # 创建一个DataFrame对象 data = pd.DataFrame({ "A": [1, 2, 3, 4], "B": pd.Timestamp('20130102'), "C": pd.Series(1, index=list(range(4)), dtype='float32'), "D": np.array([3] * 4, dtype='int32'), "E": pd.Categorical(["test", "train", "test", "train"]), "F": 'foo' }) print(data)
Ausgabeergebnisse:
A B C D E F 0 1 2013-01-02 1.0 3 test foo 1 2 2013-01-02 1.0 3 train foo 2 3 2013-01-02 1.0 3 test foo 3 4 2013-01-02 1.0 3 train foo
Lesen und Schreiben von Daten:
Pandas können mehrere Datenformate lesen und schreiben, einschließlich CSV-Dateien, Excel-Dateien, SQL-Datenbanken usw.
Beispiel zum Lesen einer CSV-Datei:
import pandas as pd # 从CSV文件中读取数据 data = pd.read_csv('data.csv') print(data.head())
Beispiel zum Lesen einer Excel-Datei:
import pandas as pd # 从Excel文件中读取数据 data = pd.read_excel('data.xlsx') print(data.head())
Datenanalyse und -verarbeitung:
pandas bietet viele leistungsstarke Funktionen und Methoden für die Datenanalyse und -verarbeitung.
Beispiel für statistische Datenanalyse:
import pandas as pd # 读取数据 data = pd.read_csv('data.csv') # 统计描述性统计信息 print(data.describe()) # 计算各列之间的相关系数 print(data.corr())
Beispiel für Datenfilterung und -sortierung:
import pandas as pd # 读取数据 data = pd.read_csv('data.csv') # 筛选出满足条件的数据 filtered_data = data[data['age'] > 30] # 按照某列进行排序 sorted_data = data.sort_values('age') print(filtered_data.head()) print(sorted_data.head())
Beispiel für Datengruppierung und -aggregation:
import pandas as pd # 读取数据 data = pd.read_csv('data.csv') # 按照某一列进行分组 grouped_data = data.groupby('gender') # 计算每组的平均值 mean_data = grouped_data.mean() print(mean_data)
Beispiel für das Schreiben von Daten in eine CSV- oder Excel-Datei:
import pandas as pd # 读取数据 data = pd.read_csv('data.csv') # 将数据写入到CSV文件中 data.to_csv('output.csv', index=False) # 将数据写入到Excel文件中 data.to_excel('output.xlsx', index=False)
Zusammenfassung:
pandas ist Python 2.x A häufig verwendete Datenanalysebibliothek. In diesem Artikel werden die Installationsmethode von Pandas und gängige Datenstrukturen, Methoden zum Lesen und Schreiben von Daten sowie gängige Methoden zur Datenanalyse und -verarbeitung vorgestellt. Leser können Pandas flexibel für die Datenanalyse und -verarbeitung entsprechend ihren eigenen Bedürfnissen verwenden.
Das Obige ist die Einführung dieses Artikels zur Verwendung des Pandas-Moduls für die Datenanalyse in Python 2.x. Ich hoffe, es wird Ihnen hilfreich sein!
Das obige ist der detaillierte Inhalt vonSo verwenden Sie das Pandas-Modul für die Datenanalyse in Python 2.x. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!