ホームページ >バックエンド開発 >Python チュートリアル >pandas を使用した行データの削除に関するチュートリアル

pandas を使用した行データの削除に関するチュートリアル

WBOY
WBOYオリジナル
2024-01-09 14:33:534803ブラウズ

pandas を使用した行データの削除に関するチュートリアル

pandas チュートリアル: pandas を使用して行データを削除する方法、特定のコード例が必要です

はじめに:
データ分析と処理では、データは多くの場合、次のことを行う必要があります。データ セット内の不要な行または無効なデータ行を削除する処理は、一般的な操作です。 Python では、pandas ライブラリは強力なデータ操作ツールを提供します。この記事では、pandas を使用して行データを削除する方法と具体的なコード例を紹介します。

  1. パンダ ライブラリのインポート
    開始する前に、まずパンダ ライブラリをインポートする必要があります。

import pandas as pd

  1. サンプル データの作成
    デモンストレーションのために、最初にいくつかのデータ行を含むサンプル データを作成します。次のコードは、「data」という名前の DataFrame オブジェクトを作成し、いくつかのデータ行を追加します。

data = {'名前': ['張三'、'李斯'、'王呉'、'趙劉'、'劉琦'],

    '年龄': [20, 25, 30, 35, 40],
    '性别': ['男', '男', '女', '男', '女']}

df = pd.DataFrame(data)

print("元データ:")
print(df)

出力結果:
元データ:
名前 年齢 性別
0 張三 20 男
1 李思 25 男
2 王呉 30 女
3 趙劉 35 男
4 劉琦 40 女

  1. 使用行データの条件付き削除
    pandas には、行データを削除するためのさまざまなメソッドが用意されています。最も一般的な方法は、条件に従って行を削除することです。つまり、特定の条件を満たす行データのみを削除します。次のサンプル コードは、経過期間が 30 以上の行を削除する方法を示しています。

df = df[df['age']

print("経過期間が 30 以上のデータを削除します:")
print( df)

出力結果:
年齢が30歳以上のデータを削除:
名前 年齢 性別
0 Zhang San 20 Male
1 Li Si 25 Male

  1. インデックスを使用して行データを削除する
    条件を使用して削除するだけでなく、インデックスを使用してデータ セット内の行を削除することもできます。行のインデックス ラベルを指定することで、pandas は指定されたデータ行を簡単に削除できます。次のサンプル コードは、データの最初と最後の行を削除する方法を示しています。

df = df.drop([0, 4])

print("データの最初と最後の行を削除します:")
print(df)

出力結果:
データの最初と最後の行を削除:
名前、年齢、性別
1 Li Si 25 男性
2 Wang Wu 30 女性
3 Zhao Liu 35男性

  1. 行番号を使用して行データを削除する
    インデックス タグを使用するだけでなく、行番号を使用して行データを削除することもできます。 Pandasでは行番号を設定することで指定した行データを削除できる「iloc」メソッドを提供しています。次のサンプル コードは、データの 2 行目と 3 行目を削除する方法を示しています。

df = df.drop(df.index[[1, 2]])

print("2行目と3行目のデータを削除します:")
print(df)

出力結果:
データの2行目と3行目を削除:
名前 年齢 性別
0 Zhang San 20 Male
3 Zhao Liu 35 Male

  1. 元のデータを変更する
    上記の例では、行データの削除は DataFrame オブジェクトのコピーに対して実行されており、元のデータは変更されていません。元のデータを変更する場合は、パラメータ「inplace=True」を追加する必要があります。次のサンプル コードは、元のデータ上で条件に一致する行を直接削除する方法を示しています。

df.drop(df[df['age'] >= 30].index, inplace=True)

print("等しいデータより大きい年齢を直接削除しますto 30: ")
print(df)

出力結果:
年齢が30以上のデータを元データ上から直接削除:
名前 年齢 性別
0 個 Three 20 Male
1 Li Si 25 Male

結論:
pandas ライブラリと上記のコード例を使用すると、DataFrame オブジェクト内の行データを簡単に削除できます。条件、インデックス ラベル、または行番号を使用して、特定の条件を満たすデータの行を選択して削除できます。これにより、データのクリーニングと処理のための非常に便利なツールと方法が提供されます。

以上がpandas を使用した行データの削除に関するチュートリアルの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。