Maison >développement back-end >Tutoriel Python >Comment sélectionner efficacement des index de colonnes spécifiques par ligne dans NumPy ?

Comment sélectionner efficacement des index de colonnes spécifiques par ligne dans NumPy ?

Patricia Arquette
Patricia Arquetteoriginal
2024-10-27 00:32:31960parcourir

How to Efficiently Select Specific Column Indexes per Row in NumPy?

NumPy : sélection efficace d'index de colonnes spécifiques par ligne

La sélection des données est une opération cruciale dans l'analyse des données. Lorsque vous travaillez avec des tableaux NumPy, la sélection de colonnes spécifiques de chaque ligne peut être une tâche courante. Cette sélection peut être effectuée avec différentes méthodes, mais la sélection de colonnes basée sur une liste d'index par ligne nécessite une approche plus efficace.

Utilisation de tableaux booléens pour la sélection directe

Si vous disposez d'un tableau booléen indiquant les colonnes à sélectionner, vous pouvez utiliser la sélection directe pour extraire efficacement les valeurs souhaitées. Des tableaux booléens peuvent être créés en comparant une liste d'index avec la plage de colonnes. Par exemple, étant donné une matrice X et une liste d'index Y comme décrit dans la question, vous pouvez créer un tableau booléen b comme suit :

<code class="python">import numpy as np

X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
Y = np.array([1, 0, 2])
b = np.arange(X.shape[1])[np.isin(np.arange(X.shape[1]), Y)]</code>

Avec le tableau booléen b, une sélection directe peut être effectuée :

<code class="python">result = X[np.arange(X.shape[0]), b]</code>

Cette méthode fournit un moyen rapide de sélectionner des colonnes spécifiques en fonction du tableau booléen.

Méthodes alternatives

Vous pouvez également utiliser np.arange et sélection directe basée sur la liste d'index Y. Cette approche consiste à créer un tableau d'indices et à sélectionner dans la matrice X en conséquence :

<code class="python">result = X[np.arange(X.shape[0]), Y]</code>

Conclusion

La sélection d'index de colonnes spécifiques par ligne dans NumPy peut être effectuée efficacement à l'aide de tableaux booléens. Cette méthode permet une sélection rapide et simple de colonnes basée sur une liste d'index. Pour de larges tableaux de données, cette approche offrira des avantages significatifs en termes de performances par rapport aux méthodes basées sur les itérations.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn