Maison >développement back-end >Tutoriel Python >Comment sélectionner efficacement les colonnes dans les Pandas DataFrames ?
Sélection de colonnes dans les dataframes Pandas
Lorsque vous traitez des tâches de manipulation de données, la sélection de colonnes spécifiques devient nécessaire. Dans Pandas, il existe différentes options pour sélectionner les colonnes.
Option 1 : Utiliser les noms de colonnes
Pour sélectionner les colonnes par leurs noms, transmettez simplement une liste de noms de colonnes comme suit :
df1 = df[['a', 'b']]
Option 2 : Utiliser le numérique Indices
Si les indices de colonnes sont connus, utilisez la fonction iloc pour les sélectionner. Notez que l'indexation Python est de base zéro.
df1 = df.iloc[:, 0:2] # Select columns with indices 0 and 1
Option alternative : indexation à l'aide d'un dictionnaire
Dans les cas où les index de colonnes peuvent changer, utilisez l'approche suivante :
column_dict = {df.columns.get_loc(c): c for idx, c in enumerate(df.columns)} df1 = df.iloc[:, list(column_dict.keys())]
Approches non recommandées
Les approches suivantes sont non recommandés car ils peuvent entraîner des erreurs :
df1 = df['a':'b'] # Slicing column names does not work df1 = df.ix[:, 'a':'b'] # Deprecated indexing method
Préservation des données d'origine
Notez que la sélection de colonnes crée uniquement une vue ou une référence au cadre de données d'origine. Si vous avez besoin d'une copie indépendante des colonnes sélectionnées, utilisez la méthode copy() :
df1 = df.iloc[:, 0:2].copy()
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!