ホームページ >バックエンド開発 >Python チュートリアル >Pandas の `groupby().count()` と `groupby().size()` の違いは何ですか?

Pandas の `groupby().count()` と `groupby().size()` の違いは何ですか?

Linda Hamilton
Linda Hamiltonオリジナル
2024-11-28 17:38:11709ブラウズ

What's the Difference Between `groupby().count()` and `groupby().size()` in Pandas?

Pandas のサイズとカウントの区別を理解する

データ操作と分析のための強力な Python ライブラリである Pandas は、次のような柔軟な操作を提供します。カテゴリごとにデータをグループ化します。グループ化されたデータを操作する場合、count メソッドと size メソッドの違いを理解することが重要です。

質問: Pandas で groupby("x").count と groupby("x").size を分けるものは何ですか? ?サイズは単に null を除外するだけですか?

答え:

カウントとサイズの違いは、NaN 値の処理にあります:

  • size: NaN 値が含まれており、基本的に観測値の合計数を提供します。各グループ。
  • count: NaN 値を除外し、各グループの null 以外の観測値の数を生成します。

例:

次のパンダについて考えてみましょうDataFrame:

df = pd.DataFrame({'a':[0,0,1,2,2,2], 'b':[1,2,3,4,np.NaN,4], 'c':np.random.randn(6)})

'a' でグループ化された 'b' 列の count メソッドと size メソッドを評価します:

print(df.groupby(['a'])['b'].count())
print(df.groupby(['a'])['b'].size())

Output:

a
0    2
1    1
2    2
Name: b, dtype: int64

a
0    2
1    1
2    3
dtype: int64

明らかなように、count メソッドではグループ 4 の NaN 値が除外されます (ここで、 'a' は 2) ですが、size メソッドにはそれが含まれます。

以上がPandas の `groupby().count()` と `groupby().size()` の違いは何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。