データ処理スキル: Pandas を使用して DataFrame 内の特定の列を削除する
データ分析と処理のプロセスにおいて、DataFrame 内の不要な列を削除することは、重要な作業の 1 つです。共通の要件。 Pandas は、Python でよく使われるデータ分析・処理ライブラリであり、豊富な機能と柔軟な操作方法を提供します。この記事では、Pandas を使用して DataFrame 内の特定の列を削除する方法を紹介し、具体的なコード例を示します。
1. まず、Pandas ライブラリをインポートし、デモンストレーション用の DataFrame を作成する必要があります:
import pandas as pd # 创建示例DataFrame data = {'姓名': ['张三', '李四', '王五', '赵六'], '性别': ['男', '女', '男', '女'], '年龄': [25, 30, 35, 28], '成绩': [80, 90, 85, 95]} df = pd.DataFrame(data) print(df)
上記のコードでは、名前、性別、年齢、および名前の 4 つの列を含む DataFrame を作成しました。
姓名 性别 年龄 成绩 0 张三 男 25 80 1 李四 女 30 90 2 王五 男 35 85 3 赵六 女 28 95
2. 次に、Pandas を使用して DataFrame 内の特定の列を削除する方法を示します。
drop
メソッドを使用します。 # 删除单个列 df_drop = df.drop('性别', axis=1) print(df_drop)
上記のコードでは、drop
メソッドを使用します。データフレームの「性別」列の 1 つの列を削除し、結果を新しいデータフレーム df_drop
に保存します。 axis=1
は列が削除されることを意味し、結果は次のようになります:
姓名 年龄 成绩 0 张三 25 80 1 李四 30 90 2 王五 35 85 3 赵六 28 95
# 删除多个列 df_drop_multi = df.drop(['年龄', '成绩'], axis=1) print(df_drop_multi)
In上記のコードでは、drop
メソッドを使用して、DataFrame の 'age' 列と 'grade' 列を削除し、結果を新しい DataFrame df_drop_multi
に保存します。結果は次のとおりです。
姓名 性别 0 张三 男 1 李四 女 2 王五 男 3 赵六 女
# 直接使用列表索引删除多个列 df_drop_iat = df[df.columns[[0, 2]]] print(df_drop_iat)
上記のコードでは、DataFrame の columns
属性とリスト インデックスを使用して削除しますDataFrame の 'name' 列と 'age' 列を入力し、その結果を新しい DataFrame df_drop_iat
に保存すると、結果は次のようになります:
姓名 年龄 0 张三 25 1 李四 30 2 王五 35 3 赵六 28
3. 上記の例を通じて、 Pandas を使用して DataFrame を削除する方法を学習しました。特定の列に対するさまざまな方法とテクニックを学びました。これらの方法の選択は、実際のニーズと個人の好みによって決まります。
概要:
drop
メソッドを使用します。これを示すには、axis=1
を指定する必要があります。列が削除されています。 df.columns
プロパティを通じて直接選択できます。 Pandas が提供する柔軟な操作と豊富な機能により、DataFrame 内のデータを簡単に処理および管理し、さまざまなデータ分析と処理のニーズを満たすことができます。
以上がPandas を使用して DataFrame 内の指定された列を削除するデータ処理テクニックの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。