ホームページ  >  記事  >  バックエンド開発  >  パンダのソートの詳細: データの順序付けされた外観の作成

パンダのソートの詳細: データの順序付けされた外観の作成

WBOY
WBOYオリジナル
2024-01-24 10:16:12625ブラウズ

パンダのソートの詳細: データの順序付けされた外観の作成

データ分析ツール pandas ソートの詳細説明: データを整然とした印象的なものにします

はじめに: データ分析のプロセスにおいて、データのソートは非常に一般的で重要な操作です。 。並べ替えるとデータが整然として見えるようになり、データの分析と視覚化が容易になります。 Python では、pandas ライブラリによって強力な並べ替え関数が提供されています。この記事では、pandas の並べ替え方法を詳しく紹介し、具体的なコード例を示します。

1. ソートの基本概念
データ分析では、特定の列または複数の列に従って昇順または降順でソートを実行できます。このうち、昇順とは小さいものから大きいものへ並べ替えることを意味し、降順とは大きいものから小さいものへ並べ替えることを意味します。

2. Pandas の並べ替えメソッド
pandas では、sort_values() と sort_index() という 2 つの一般的に使用される並べ替えメソッドがあります。

  1. sort_values()
    sort_values() メソッドは、値による並べ替え、つまり列の数値による並べ替えに使用されます。このメソッドには次の共通パラメータがあります。
  • #by: 並べ替える列名。単一の列名または複数の列名を含むリストを指定できます。
  • ascending: 並べ替え方法。True は昇順を意味し、False は降順を意味します。デフォルトは True です。
  • inplace: 元のデータを変更するかどうか。True は元のデータを変更することを意味します。False は、新しい並べ替えられたデータ コピーを生成することを意味します。デフォルトは False です。
  1. sort_index()
    sort_index() メソッドは、インデックスによる並べ替え、つまり行のインデックスによる並べ替えに使用されます。このメソッドには次の共通パラメータがあります:
  • axis: 並べ替えの軸方向。0 は行インデックスによる並べ替えを意味し、1 は列インデックスによる並べ替えを意味します。デフォルトは 0 です。
  • ascending: 並べ替え方法。True は昇順を意味し、False は降順を意味します。デフォルトは True です。
  • inplace: 元のデータを変更するかどうか。True は元のデータを変更することを意味します。False は、新しい並べ替えられたデータ コピーを生成することを意味します。デフォルトは False です。

3. Pandas の並べ替えの例
以下では、いくつかの例を使用して pandas の並べ替え機能を示します。

  1. 単一列による並べ替え
    次のデータ セットがあるとします:
import pandas as pd

data = {'姓名': ['Tom', 'Jerry', 'Spike', 'Tyke'],
        '年龄': [20, 25, 18, 30],
        '性别': ['男', '男', '女', '男']}
df = pd.DataFrame(data)
print(df)

出力結果は次のとおりです:

     姓名  年龄 性别
0   Tom  20  男
1  Jerry  25  男
2  Spike  18  女
3   Tyke  30  男

次に、 age 列で降順に並べ替えます 並べ替え:

df.sort_values(by='年龄', ascending=False, inplace=True)
print(df)

出力結果は次のとおりです:

     姓名  年龄 性别
3   Tyke  30  男
1  Jerry  25  男
0   Tom  20  男
2  Spike  18  女
  1. 複数の列で並べ替えます
    場合によっては、複数の列で並べ替える必要がある場合があります。列。上記のデータに「給与」列を追加し、年齢と給与で並べ替えるとします。
data = {'姓名': ['Tom', 'Jerry', 'Spike', 'Tyke'],
        '年龄': [20, 25, 18, 30],
        '性别': ['男', '男', '女', '男'],
        '工资': [5000, 6000, 4000, 7000]}
df = pd.DataFrame(data)
print(df)

出力結果は次のようになります。

     姓名  年龄 性别   工资
0   Tom  20  男  5000
1  Jerry  25  男  6000
2  Spike  18  女  4000
3   Tyke  30  男  7000

次に、年齢と給与で並べ替えます。降順:

df.sort_values(by=['年龄', '工资'], ascending=False, inplace=True)
print(df)

出力結果は次のとおりです:

     姓名  年龄 性别   工资
3   Tyke  30  男  7000
1  Jerry  25  男  6000
0   Tom  20  男  5000
2  Spike  18  女  4000
  1. 行インデックスによる並べ替え
    列による並べ替えに加えて、行インデックスによる並べ替えも可能です。上記のデータの行インデックスを ['c', 'a', 'b', 'd'] に変更し、行インデックスで昇順に並べ替えるとします。出力結果は:
  2. df.index = ['c', 'a', 'b', 'd']
    df.sort_index(axis=0, ascending=True, inplace=True)
    print(df)
上記は、パンダの並べ替えの基本的な概要と例です。sort_values() メソッドと sort_index() メソッドを使用すると、データを簡単に並べ替えて、整然とした印象的なデータにすることができます。この記事がデータ分析にパンダをより適切に適用するのに役立つことを願っています。

以上がパンダのソートの詳細: データの順序付けされた外観の作成の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。