Heim >Backend-Entwicklung >Python-Tutorial >So lesen und bearbeiten Sie CSV-Daten mit der Pandas-Bibliothek von Python
So verwenden Sie Pandas zum Lesen von CSV-Dateien und zur Datenverarbeitung
Pandas ist ein leistungsstarkes Datenverarbeitungs- und Analysetool, das Funktionen zum Lesen, Bearbeiten und Analysieren von Daten in verschiedenen Formaten bietet. In diesem Artikel stellen wir vor, wie man mit Pandas CSV-Dateien liest und Daten verarbeitet.
Stellen Sie zunächst sicher, dass Sie die Pandas-Bibliothek installiert haben. Wenn es noch nicht installiert ist, können Sie es installieren, indem Sie den folgenden Befehl im Terminal ausführen:
pip install pandas
Als Nächstes demonstrieren wir die Verwendung der folgenden CSV-Beispieldatei:
name,age,city John,30,New York Alice,25,Los Angeles Bob,35,Chicago
Beginnen wir nun mit dem Schreiben des Codes zum Lesen der Datei und verarbeiten die Daten.
Importieren Sie zunächst die Pandas-Bibliothek:
import pandas as pd
Lesen Sie dann die CSV-Datei mit der Funktion read_csv()
: read_csv()
函数读取CSV文件:
df = pd.read_csv('data.csv')
这将创建一个名为df
的pandas DataFrame对象来存储CSV文件的内容。
如果你想查看读取的数据,可以使用head()
函数来显示前几行数据:
print(df.head())
接下来,让我们介绍一些常用的数据处理操作。
name_column = df['name'] age_column = df['age']
loc
或iloc
函数:row_0 = df.loc[0] # 使用索引选择第一行数据 row_1 = df.iloc[1] # 使用位置选择第二行数据
filtered_data = df[df['age'] > 30] # 筛选年龄大于30的数据
insert()
函数添加新的列:df.insert(3, 'country', ['USA', 'USA', 'USA']) # 添加一个名为'country'的列,所有行的值都是'USA'
drop()
函数:df = df.drop('city', axis=1) # 删除名为'city'的列
df.loc[0, 'age'] = 31 # 修改第一行'age'列的值为31 df['age'] = df['age'] + 1 # 将'age'列的所有值加1
这些只是pandas提供的许多数据处理操作中的一部分。根据你的具体需求,还可以执行其他操作,如排序数据、合并数据和计算统计信息等。
最后,将数据保存到新的CSV文件中,可以使用to_csv()
df.to_csv('new_data.csv', index=False) # 将数据保存到名为'new_data.csv'的文件中,不包含行索引Dadurch wird ein Pandas-DataFrame mit dem Namen
df
erstellt Objekt zum Speichern des Inhalts einer CSV-Datei. Wenn Sie die gelesenen Daten anzeigen möchten, können Sie die Funktion head()
verwenden, um die ersten Datenzeilen anzuzeigen: rrreee
Als nächstes stellen wir einige gängige Datenverarbeitungsvorgänge vor. 🎜loc
oder iloc
verwenden: insert()
Funktion zum Hinzufügen einer neuen Spalte:drop()
Funktion: to_csv()
verwenden: 🎜rrreee🎜Dies ist die grundlegende Methode und einige gängige Vorgänge bei der Verwendung von Pandas zum Lesen von CSV-Dateien und Datenverarbeitung durchführen. Mit diesen Vorgängen können Sie Daten in verschiedenen Formaten problemlos verarbeiten und analysieren. 🎜🎜Ich hoffe, dass dieser Artikel für Sie hilfreich ist, und wünsche Ihnen viel Erfolg auf Ihrem Weg zur Datenverarbeitung und -analyse! 🎜Das obige ist der detaillierte Inhalt vonSo lesen und bearbeiten Sie CSV-Daten mit der Pandas-Bibliothek von Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!