ホームページ >バックエンド開発 >Python チュートリアル >**NumPy 配列の一意の値の頻度を効率的にカウントするにはどうすればよいですか?**
データ分析における一般的なタスクは、特定のデータセット内の各固有の値の出現頻度を決定することです。 NumPy は、数値データの配列に対してこれを実現するための効率的な方法をいくつか提供します。
1 つの方法は、return_counts パラメータを True に設定して np.unique 関数を利用することです (NumPy バージョン 1.9 以降で利用可能)。このパラメータは、一意の値だけでなく、それに対応するカウントも返します。
<code class="python">import numpy as np x = np.array([1,1,1,2,2,2,5,25,1,1]) unique, counts = np.unique(x, return_counts=True) print(np.asarray((unique, counts)).T) ''' Output: [[ 1 5] [ 2 3] [ 5 1] [25 1]] '''</code>
次のタイミング比較が示すように、このメソッドは効率の点で scipy.stats.itemfreq よりも優れています。
<code class="python">import numpy as np import scipy.stats x = np.random.random_integers(0,100,1e6) %timeit unique, counts = np.unique(x, return_counts=True) 10 loops, best of 3: 31.5 ms per loop %timeit scipy.stats.itemfreq(x) 10 loops, best of 3: 170 ms per loop</code>
以上が**NumPy 配列の一意の値の頻度を効率的にカウントするにはどうすればよいですか?**の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。