ホームページ  >  記事  >  バックエンド開発  >  NumPy 配列内の一意の値の頻度を効率的にカウントするにはどうすればよいですか?

NumPy 配列内の一意の値の頻度を効率的にカウントするにはどうすればよいですか?

Patricia Arquette
Patricia Arquetteオリジナル
2024-10-28 07:03:30991ブラウズ

How can I efficiently count the frequency of unique values in a NumPy array?

NumPy 配列内の固有の値の頻度カウントを取得する

NumPy 配列内の各固有の値の頻度を効率的に決定するには、次の利用を検討してください。 return_counts=True と組み合わせた NumPy のユニークな関数。

<code class="python">import numpy as np

x = np.array([1,1,1,2,2,2,5,25,1,1])
unique, counts = np.unique(x, return_counts=True)</code>

このアプローチでは、元の配列に存在する一意の値を保持する unique と、それぞれの頻度を示す counts の 2 つの配列を含むタプルが生成されます。

たとえば、指定された入力配列を使用して上記のコードを実行すると、次が返されます。

[(1, 5), (2, 3), (5, 1), (25, 1)]

は、値 1 が 5 回出現し、2 が 3 回出現し、5 回出現することを示します。は 1 回表示され、25 は 1 回表示されます。

以下のコード スニペットに示すように、unique(return_counts=True) を使用すると、大規模なデータセットに対して SciPy の scipy.stats.itemfreq 関数よりもパフォーマンスが大幅に向上します。

<code class="python">In [4]: x = np.random.random_integers(0,100,1e6)

In [5]: %timeit unique, counts = np.unique(x, return_counts=True)
10 loops, best of 3: 31.5 ms per loop

In [6]: %timeit scipy.stats.itemfreq(x)
10 loops, best of 3: 170 ms per loop</code>

以上がNumPy 配列内の一意の値の頻度を効率的にカウントするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。