Maison >développement back-end >Tutoriel Python >Comment mettre à jour les lignes et les colonnes à l'aide de Python Pandas

Comment mettre à jour les lignes et les colonnes à l'aide de Python Pandas

WBOY
WBOYavant
2023-05-30 19:16:171355parcourir

1. Créer un ensemble de données Pandas

Pour créer un bloc de données, pandas fournit le nom de fonction pd.DataFrame, qui peut vous aider à créer un bloc de données à partir de certaines données. Voyons comment cela fonctionne.

#创建一个字典

import pandas as pd

fruit_data = {"Fruit": ['Apple','Avacado','Banana','Strawberry','Grape'],"Color": ['Red','Green','Yellow','Pink','Green'],
"Price": [45, 90, 60, 37, 49]
}

fruit_data

Ici, nous construisons un dictionnaire Python qui inclut certains éléments de données. Maintenant, on nous demande de transformer ce dictionnaire en un ensemble de données Pandas.

#Dataframe 

data = pd.DataFrame(fruit_data)
data

Comment mettre à jour les lignes et les colonnes à laide de Python Pandas

C'est parfait ! En utilisant la fonction pd.DataFrame de pandas, nous pouvons facilement convertir un dictionnaire en un ensemble de données pandas. Notre ensemble de données est maintenant prêt pour de futures opérations. pd.DataFrame 函数,我们可以轻松地将字典转换为 pandas 数据集。 我们的数据集现在已准备好执行未来的操作。

更新列

有时,要素的列或名称会不一致。 它可以是字母表的大小写等等。 拥有统一的设计有助于我们有效地使用这些功能。

因此,作为第一步,我们将了解如何更新/更改数据中的列或特征名称。

#update the column name

data.rename(columns = {'Fruit':'Fruit Name'})

Comment mettre à jour les lignes et les colonnes à laide de Python Pandas

如上图所示简单。 大家甚至可以一次更新多个列名。 为此,我们必须在大括号下添加以逗号分隔的其他列名。

#multile column update

data.rename(columns = {'Fruit':'Fruit Name','Colour':'Color','Price':'Cost'})

就像这样,我们可以同时更新所有列。

更新列名的大小写

在处理具有许多列的数据集时,我们可能会遇到列名不一致的情况。

在我们的数据中,大家可以观察到所有列名的首字母大写。 始终建议为所有列名使用通用大小写。

好吧,我们可以将它们转换为大写或小写。

#lower case

data.columns.str.lower()
data

Comment mettre à jour les lignes et les colonnes à laide de Python Pandas

现在,我们所有的列名都是小写的。

更新行

和更新列一样,更新行也很简单。 我们必须先找到行值,然后才能使用新值更新该行。

我们可以使用 pandas loc

Mettre à jour les colonnes

Parfois, les colonnes ou les noms des fonctionnalités seront incohérents. Il peut s'agir des majuscules et des minuscules de l'alphabet, etc. Avoir une conception unifiée nous aide à utiliser ces fonctionnalités efficacement.

Comment mettre à jour les lignes et les colonnes à laide de Python PandasDonc, dans un premier temps, nous comprendrons comment mettre à jour/modifier les noms de colonnes ou de fonctionnalités dans les données.

#updating rows

data.loc[3]

Comment utiliser Python Pandas pour mettre à jour les lignes et les colonnes

Comme indiqué ci-dessus Montré simplement. Vous pouvez même mettre à jour plusieurs noms de colonnes à la fois. Pour ce faire, nous devons ajouter des noms de colonnes supplémentaires séparés par des virgules sous des accolades.

Fruit    Strawberry
Color          Pink
Price            37
Name: 3, dtype: object

Juste comme ça, nous pouvons mettre à jour toutes les colonnes en même temps. Comment mettre à jour les lignes et les colonnes à laide de Python Pandas

Mise à jour du cas des noms de colonnes

Lorsque nous traitons des ensembles de données comportant de nombreuses colonnes, nous pouvons rencontrer des noms de colonnes incohérents.

Dans nos données, vous pouvez observer que la première lettre de tous les noms de colonnes est en majuscule. Il est toujours recommandé d'utiliser une casse commune pour tous les noms de colonnes.

D'accord, nous pouvons les convertir en majuscules ou en minuscules.

#update

data.loc[3] = ['PineApple','Yellow','48']
data

Comment mettre à jour les lignes et les colonnes à l'aide de Python Pandas

Maintenant , Tous nos noms de colonnes sont en minuscules.

Mise à jour des lignes

Comment mettre à jour les lignes et les colonnes à laide de Python PandasLa mise à jour des lignes est aussi simple que la mise à jour des colonnes. Nous devons trouver la valeur de la ligne avant de pouvoir mettre à jour la ligne avec la nouvelle valeur.

🎜Nous pouvons utiliser la fonction pandas loc pour localiser les lignes. 🎜
#更新特定值

data.loc[3, ['Price']]
Price    48
Name: 3, dtype: object
🎜Nous avons trouvé la rangée 3 qui contient les détails du fruit fraise. Nous devons mettre à jour cette ligne pour fournir un nouveau nom de fruit comme Ananas et ses détails. 🎜
#updating 

data.loc[3, ['Price']] = [65]
data
🎜🎜🎜🎜 J'espère que vous trouverez tous également facile de mettre à jour les valeurs des lignes de vos données. Supposons maintenant que nous devions simplement mettre à jour certains détails de la ligne, plutôt que l'ensemble des détails. Alors, qu’en pensez-vous ? 🎜
#Condition

updated = data['Price'] > 60
updated
0    False
1     True
2    False
3     True
4    False
Name: Price, dtype: bool
🎜Il suffit de mettre à jour le prix du fruit situé à la ligne 3. On sait que le prix actuel du fruit est de 48. Cependant, nous devons le mettre à jour à 65. Faisons ça. 🎜
#Updating

data.loc[updated, 'Price'] = 'Expensive'
data
🎜🎜🎜🎜Nous mettons à jour le prix du fruit ananas à 65 avec une seule ligne de code python. Voilà comment ça marche. Simple. 🎜🎜Mettre à jour les lignes et les colonnes en fonction des conditions🎜🎜Oui, nous mettrons désormais à jour les valeurs des lignes en fonction de conditions spécifiques. Enfin, nous voulons des valeurs significatives qui devraient faciliter notre analyse. 🎜🎜Définissons nos conditions. 🎜rrreee🎜Ce que nous voulons faire ici, c'est mettre à jour le prix des fruits au-dessus de 60 vers cher. 🎜rrreee🎜Selon le rendement, nous avons 2 fruits avec un prix supérieur à 60. Listons ces fruits comme étant chers dans les données. 🎜rrreee🎜🎜🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer