ホームページ  >  記事  >  バックエンド開発  >  Pandas で nunique() を使用してグループ内の一意の値を数える方法

Pandas で nunique() を使用してグループ内の一意の値を数える方法

Susan Sarandon
Susan Sarandonオリジナル
2024-10-18 15:44:03461ブラウズ

How to Count Unique Values Within Groups Using nunique() in Pandas?

nunique を使用した Pandas のグループごとの一意の値のカウント

パンダでは、nunique() メソッドを使用してグループ内の一意の値をカウントできます。これは、特定のカテゴリまたはグループ内の個別の値の数を決定する必要があるデータを操作する場合に特に便利です。

問題:

次のような DataFrame を考えてみましょう。データ:

ID domain
123 vk.com
123 vk.com
123 twitter.com
456 vk.com
456 facebook.com
456 vk.com
456 google.com
789 twitter.com
789 vk.com

タスクは、この DataFrame 内の各ドメインの一意の ID をカウントすることです。

解決策:

一意の値をカウントするにはグループごとに、必要なグループ化列を指定して nunique() メソッドを使用します。この場合、ドメイン列はグループを表します:

<code class="python">df = df.groupby('domain')['ID'].nunique()
print(df)</code>

出力:

domain count
facebook.com 1
google.com 1
twitter.com 2
vk.com 3

追加の考慮事項:

  • ドメイン値から一重引用符 (') を削除するには、グループ化する前に str.strip("'") メソッドを使用します。
  • 列名を保持するには、as_index=False 引数を使用します。 groupby() で nunique() メソッドを agg() 関数に渡します。

以上がPandas で nunique() を使用してグループ内の一意の値を数える方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。