ホームページ >バックエンド開発 >Python チュートリアル >NumPy 配列内の一意の値の頻度を効率的にカウントするにはどうすればよいですか?
NumPy 配列内の固有の値の頻度カウントを取得する
NumPy 配列内の各固有の値の頻度を効率的に決定するには、次の利用を検討してください。 return_counts=True と組み合わせた NumPy のユニークな関数。
<code class="python">import numpy as np x = np.array([1,1,1,2,2,2,5,25,1,1]) unique, counts = np.unique(x, return_counts=True)</code>
このアプローチでは、元の配列に存在する一意の値を保持する unique と、それぞれの頻度を示す counts の 2 つの配列を含むタプルが生成されます。
たとえば、指定された入力配列を使用して上記のコードを実行すると、次が返されます。
[(1, 5), (2, 3), (5, 1), (25, 1)]
は、値 1 が 5 回出現し、2 が 3 回出現し、5 回出現することを示します。は 1 回表示され、25 は 1 回表示されます。
以下のコード スニペットに示すように、unique(return_counts=True) を使用すると、大規模なデータセットに対して SciPy の scipy.stats.itemfreq 関数よりもパフォーマンスが大幅に向上します。
<code class="python">In [4]: x = np.random.random_integers(0,100,1e6) In [5]: %timeit unique, counts = np.unique(x, return_counts=True) 10 loops, best of 3: 31.5 ms per loop In [6]: %timeit scipy.stats.itemfreq(x) 10 loops, best of 3: 170 ms per loop</code>
以上がNumPy 配列内の一意の値の頻度を効率的にカウントするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。