##今日は pandas データ処理このトピックの 6 番目の記事では、DataFrame の並べ替えと集計操作について説明します。
前回の記事では、主に DataFrame の apply メソッド、つまり DataFrame の各行または列に対してブロードキャスト操作を実行する方法を紹介しました。これにより、非常に簡単にブロードキャスト操作を実行できるようになります。短時間 一定の時間内にデータ全体を処理します。今日は、ニーズに応じて DataFrame を並べ替える方法と、いくつかの要約操作の使用方法について説明します。
Sort
Sort は私たちにとって非常に基本的なニーズです。pandas では、これは要件は、 インデックスに基づいた の並べ替えと、 値に基づいた の並べ替えにさらに分割されます。まずはSeriesでの並び替え方法を見てみましょう。
Series には 2 つの並べ替え方法があり、1 つは sort_index で、その名前が示すように、これらの値は Series のインデックスに従って並べ替えられます。もう 1 つは sort_values で、Series 内の値に従って並べ替えられます。どちらのメソッドも新しいシリーズを返します:
インデックス ソート
同じことが DataFrame にも当てはまります。DataFrame には、値による並べ替えとインデックスによる並べ替えという 2 つの機能があります。ただし、DataFrame は 2 次元データであるため、使用方法がいくつか異なります。最も単純な違いは、Series には列が 1 つしかないことです。並べ替えオブジェクトは明確にわかっていますが、DataFrame はわかっていません。そのインデックスは、行インデックスと列インデックスの 2 つのタイプに分かれています。したがって、 を並べ替えるときは、並べ替える軸 (つまり axis) を指定する必要があります。
デフォルトでは、行インデックスに基づいて並べ替えられます。列インデックスに基づいて並べ替えを指定したい場合は、パラメータ axis=1 を渡す必要があります。
昇順パラメータを渡して、希望する並べ替え順序が 順方向か逆順 かを指定することもできます。
#値の並べ替え
DataFrame の値の並べ替えは異なります。行はソートできません。 は列 でのみソートできます。 by パラメーターを介して並べ替える列を渡します。これは 1 列または複数列にすることができます。
##Ranking## 要素の Rank # を取得したい場合があります。 ##, 現在の要素が全体の中で何番目に位置するのか知りたいのですが、この関数はpandasにも用意されているrankメソッドです。
何気なく入力した数字の列に 7 が 2 つ含まれていることがわかります。7 はシリーズの中で最大の数字ですが、なぜランキングが 6.5 なのでしょうか? ランキングを与える 場合は、method パラメーターを使用して必要な効果を指定できます。
#method の正当なパラメータは first に限定されるものではなく、少し一般的ではない他の使用方法もいくつかありますので、それらをまとめてリストします。 以上がパンダの DataFrame でのメソッドの並べ替えと要約のスキルの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。