Maison >développement back-end >Tutoriel Python >Comment lire et manipuler des données CSV à l'aide de la bibliothèque pandas de Python
Comment utiliser pandas pour lire des fichiers CSV et effectuer un traitement de données
pandas est un puissant outil de traitement et d'analyse de données qui fournit des fonctions de lecture, de manipulation et d'analyse de données dans différents formats. Dans cet article, nous expliquerons comment utiliser les pandas pour lire des fichiers CSV et effectuer le traitement des données.
Tout d’abord, assurez-vous que la bibliothèque pandas est installée. S'il n'est pas encore installé, vous pouvez l'installer en exécutant la commande suivante dans le terminal :
pip install pandas
Ensuite, nous allons faire une démonstration en utilisant l'exemple de fichier CSV suivant :
name,age,city John,30,New York Alice,25,Los Angeles Bob,35,Chicago
Maintenant, commençons à écrire le code pour lire le fichier. et traiter les données.
Tout d'abord, importez la bibliothèque pandas :
import pandas as pd
Ensuite, lisez le fichier CSV à l'aide de la fonction read_csv()
: read_csv()
函数读取CSV文件:
df = pd.read_csv('data.csv')
这将创建一个名为df
的pandas DataFrame对象来存储CSV文件的内容。
如果你想查看读取的数据,可以使用head()
函数来显示前几行数据:
print(df.head())
接下来,让我们介绍一些常用的数据处理操作。
name_column = df['name'] age_column = df['age']
loc
或iloc
函数:row_0 = df.loc[0] # 使用索引选择第一行数据 row_1 = df.iloc[1] # 使用位置选择第二行数据
filtered_data = df[df['age'] > 30] # 筛选年龄大于30的数据
insert()
函数添加新的列:df.insert(3, 'country', ['USA', 'USA', 'USA']) # 添加一个名为'country'的列,所有行的值都是'USA'
drop()
函数:df = df.drop('city', axis=1) # 删除名为'city'的列
df.loc[0, 'age'] = 31 # 修改第一行'age'列的值为31 df['age'] = df['age'] + 1 # 将'age'列的所有值加1
这些只是pandas提供的许多数据处理操作中的一部分。根据你的具体需求,还可以执行其他操作,如排序数据、合并数据和计算统计信息等。
最后,将数据保存到新的CSV文件中,可以使用to_csv()
df.to_csv('new_data.csv', index=False) # 将数据保存到名为'new_data.csv'的文件中,不包含行索引Cela créera un DataFrame pandas nommé
df
Objet pour stocker le contenu d'un fichier CSV. Si vous souhaitez afficher les données lues, vous pouvez utiliser la fonction head()
pour afficher les premières lignes de données : rrreee
Ensuite, introduisons quelques opérations courantes de traitement des données. 🎜loc
ou iloc
: insert()
Fonction pour ajouter une nouvelle colonne :drop()
Fonction : to_csv()
: 🎜rrreee🎜Il s'agit de la méthode de base et de quelques opérations courantes d'utilisation de pandas pour lire des fichiers CSV et effectuer un traitement de données. Grâce à ces opérations, vous pouvez facilement traiter et analyser des données dans une variété de formats différents. 🎜🎜J'espère que cet article vous sera utile et je vous souhaite du succès dans votre parcours de traitement et d'analyse de données ! 🎜Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!