Maison >développement back-end >Tutoriel Python >Pourquoi les « iterrows » de Pandas sont-elles si lentes et comment puis-je améliorer les performances ?
Problèmes de performances avec les iterrows Pandas
iterrows, une fonction pandas pour l'itération par ligne, a été observé pour présenter des défauts de performances. Bien que le problème puisse être lié à des types mixtes dans le dataframe, même des scénarios simples sans ce problème démontrent des retards de performances importants.
Les opérations vectorisées, telles que l'application, surpassent souvent les iterrows, soulevant des questions sur la nécessité du row-by itération de ligne. Cependant, il existe des cas où iterrows reste inévitable.
Raisons des problèmes de performances d'Iterrows
En général, iterrows est moins efficace que la vectorisation, l'application et les iterrows en raison des caractéristiques de performances. :
Directives pour des performances optimales
Pour optimiser les performances, tenez compte des directives suivantes :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!