ホームページ  >  記事  >  バックエンド開発  >  SQL の COUNT(DISTINCT) を Pandas に変換する: nunique() メソッドを使用する方法

SQL の COUNT(DISTINCT) を Pandas に変換する: nunique() メソッドを使用する方法

Barbara Streisand
Barbara Streisandオリジナル
2024-10-23 14:14:02451ブラウズ

Translating SQL's COUNT(DISTINCT) to Pandas: How to Use nunique() Method?

SQL の COUNT(DISTINCT) を Pandas の等価物に変換する

データ操作の分野では、Pandas は表形式を管理するための強力なツールとして浮上しています。データ。 Oracle や SQL Server などの多様なデータ ソースを扱う場合、ユーザーは SQL クエリを効率的な Pandas 操作に変換する際に課題に遭遇する可能性があります。一般的なタスクの 1 つは、個別の値の数をカウントすることです。これは、SQL の COUNT(DISTINCT) 関数と「同等」を呼び出すタスクです。

Pandas でこれを実現するには、列を含むテーブルの探索を始めましょう。 YEARMONTH、CLIENTCODE、その他のさまざまな属性を表します。 SQL では、年間の個別のクライアントの数を次のクエリでカウントできます。

SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;

このクエリでは、年間の個別のクライアントの数を表示する結果が得られます。この機能を Pandas で複製するにはどうすればよいでしょうか?

解決策は nunique() メソッドを利用することです:

table.groupby('YEARMONTH').CLIENTCODE.nunique()

この式はデータを YEARMONTH 列でグループ化し、nunique() を適用します。各グループ内の CLIENTCODE シリーズへのメソッド。結果は、YEARMONTH 値と各年の個別のクライアント数をリストする DataFrame です。

説明のために、table という名前のサンプル DataFrame を考えてみましょう。

   CLIENTCODE  YEARMONTH
0           1     201301
1           1     201301
2           2     201301
3           1     201302
4           2     201302
5           2     201302
6           3     201302

nunique( ) メソッドの結果:

YEARMONTH
201301       2
201302       3

したがって、Pandas の nunique() メソッドは、指定された列内の個別の値を効率的にカウントするための SQL の COUNT(DISTINCT) と同等の機能を提供します。

以上がSQL の COUNT(DISTINCT) を Pandas に変換する: nunique() メソッドを使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。