Maison >développement back-end >Tutoriel Python >Pourquoi devriez-vous toujours copier les DataFrames Pandas lors de la sélection de sous-ensembles ?
Dans Pandas, lors de la sélection d'une partie d'un bloc de données, il est courant d'utiliser le '.copy() ' méthode pour créer une copie du bloc de données d'origine. Cette approche garantit que toute modification apportée au sous-ensemble n'affectera pas le bloc de données parent.
Pourquoi faire une copie ?
Par défaut, l'indexation d'un bloc de données renvoie un vue du bloc de données d'origine, plutôt qu'une copie. Cela signifie que toute modification apportée au sous-ensemble aura un impact direct sur la trame de données parent. Pour maintenir l'intégrité du bloc de données parent, il est essentiel de créer une copie à l'aide de la méthode '.copy()'.
Conséquences de la non-copie
Considérez les extrait de code suivant :
df = pd.DataFrame({'x': [1, 2]}) df_sub = df.iloc[0:1] df_sub.x = -1
Dans cet exemple, df_sub est une vue de df. Par conséquent, définir df_sub.x sur -1 modifie également df.x :
print(df) x 0 -1 1 2
Avantages de la copie
La copie des trames de données garantit que la trame de données parent reste intact. Ceci est particulièrement important lorsque plusieurs opérations sont effectuées sur une trame de données et il est crucial de conserver les données d'origine pour une analyse ou une comparaison ultérieure.
df_sub_copy = df.iloc[0:1].copy() df_sub_copy.x = -1 print(df) x 0 1 1 2
Dans cet extrait de code modifié, df_sub_copy est une copie de df. Par conséquent, la modification de df_sub_copy.x n'a aucun impact sur df.
Remarque : Il est important de noter que le comportement de l'indexation des trames de données a changé dans les versions plus récentes de Pandas. Dans Pandas 1.0 et versions antérieures, l'indexation d'un bloc de données renvoie une copie par défaut. Cependant, dans Pandas 1.1 et versions ultérieures, l'indexation renvoie une vue. Pour garantir un comportement cohérent entre les versions, il est recommandé de toujours utiliser la méthode « .copy() » lors de la création de sous-ensembles de blocs de données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!