Maison >développement back-end >Tutoriel Python >Comment extraire efficacement plusieurs colonnes d'un DataFrame Pandas à l'aide d'une fonction personnalisée ?
Extraction de plusieurs colonnes avec la fonction Pandas
Cette question explore le problème de l'extraction de plusieurs colonnes d'un DataFrame pandas à l'aide d'une fonction personnalisée. Le type de retour de la fonction devient problématique car il doit s'aligner correctement avec le résultat souhaité.
Initialement, l'approche recommandée consistait à parcourir les lignes à l'aide de df.iterrows(). Cependant, cette méthode s’est avérée plus tard nettement plus lente. Par conséquent, l'auteur a choisi de diviser la fonction en six appels map(lambda ...) distincts pour extraire les colonnes souhaitées.
Une approche plus efficace consiste à utiliser la fonction zip pour attribuer les sorties de la fonction personnalisée. sur plusieurs colonnes simultanément. Cette méthode est illustrée à l'aide d'un exemple où une fonction nommée puissances est appliquée à une colonne de nombres. La fonction calcule six valeurs de puissance pour chaque nombre et les résultats sont attribués à six nouvelles colonnes dans le DataFrame.
Cette approche est à la fois élégante et efficace, et évite d'avoir à parcourir les lignes du DataFrame. C'est une technique recommandée pour extraire plusieurs colonnes d'un DataFrame basée sur une fonction personnalisée.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!