ホームページ >バックエンド開発 >Python チュートリアル >SQL の COUNT(DISTINCT) を Pandas に変換する: nunique() メソッドを使用する方法
SQL の COUNT(DISTINCT) を Pandas の等価物に変換する
データ操作の分野では、Pandas は表形式を管理するための強力なツールとして浮上しています。データ。 Oracle や SQL Server などの多様なデータ ソースを扱う場合、ユーザーは SQL クエリを効率的な Pandas 操作に変換する際に課題に遭遇する可能性があります。一般的なタスクの 1 つは、個別の値の数をカウントすることです。これは、SQL の COUNT(DISTINCT) 関数と「同等」を呼び出すタスクです。
Pandas でこれを実現するには、列を含むテーブルの探索を始めましょう。 YEARMONTH、CLIENTCODE、その他のさまざまな属性を表します。 SQL では、年間の個別のクライアントの数を次のクエリでカウントできます。
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
このクエリでは、年間の個別のクライアントの数を表示する結果が得られます。この機能を Pandas で複製するにはどうすればよいでしょうか?
解決策は nunique() メソッドを利用することです:
table.groupby('YEARMONTH').CLIENTCODE.nunique()
この式はデータを YEARMONTH 列でグループ化し、nunique() を適用します。各グループ内の CLIENTCODE シリーズへのメソッド。結果は、YEARMONTH 値と各年の個別のクライアント数をリストする DataFrame です。
説明のために、table という名前のサンプル DataFrame を考えてみましょう。
CLIENTCODE YEARMONTH 0 1 201301 1 1 201301 2 2 201301 3 1 201302 4 2 201302 5 2 201302 6 3 201302
nunique( ) メソッドの結果:
YEARMONTH 201301 2 201302 3
したがって、Pandas の nunique() メソッドは、指定された列内の個別の値を効率的にカウントするための SQL の COUNT(DISTINCT) と同等の機能を提供します。
以上がSQL の COUNT(DISTINCT) を Pandas に変換する: nunique() メソッドを使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。