Rumah >pembangunan bahagian belakang >Tutorial Python >Teknik pemprosesan data untuk memadamkan lajur tertentu dalam DataFrame menggunakan Panda

Teknik pemprosesan data untuk memadamkan lajur tertentu dalam DataFrame menggunakan Panda

PHPz
PHPzasal
2024-01-09 21:10:191507semak imbas

Teknik pemprosesan data untuk memadamkan lajur tertentu dalam DataFrame menggunakan Panda

Kemahiran pemprosesan data: Gunakan Panda untuk memadamkan lajur tertentu dalam DataFrame

Semasa analisis dan pemprosesan data, pemadaman lajur yang tidak perlu dalam DataFrame ialah salah satu keperluan biasa. Pandas ialah pustaka analisis dan pemprosesan data yang biasa digunakan dalam Python, menyediakan fungsi yang kaya dan kaedah operasi yang fleksibel. Artikel ini akan memperkenalkan cara menggunakan Panda untuk memadamkan lajur tertentu dalam DataFrame dan memberikan contoh kod khusus.

1 Pertama, kita perlu mengimport pustaka Pandas dan mencipta DataFrame untuk demonstrasi:

import pandas as pd

# 创建示例DataFrame
data = {'姓名': ['张三', '李四', '王五', '赵六'],
        '性别': ['男', '女', '男', '女'],
        '年龄': [25, 30, 35, 28],
        '成绩': [80, 90, 85, 95]}
df = pd.DataFrame(data)

print(df)

Dalam kod di atas, kami mencipta DataFrame yang mengandungi empat lajur nama, jantina, umur dan gred, dan mencetaknya keputusan adalah seperti berikut :

  姓名 性别  年龄  成绩
0  张三  男  25  80
1  李四  女  30  90
2  王五  男  35  85
3  赵六  女  28  95

2. Seterusnya, kami akan menunjukkan cara memadam lajur tertentu dalam DataFrame menggunakan Panda.

  1. Gunakan kaedah drop untuk memadamkan satu lajur drop方法删除单个列
# 删除单个列
df_drop = df.drop('性别', axis=1)

print(df_drop)

以上代码中,我们使用drop方法删除了DataFrame中的'性别'列,并将结果保存在新的DataFrame df_drop中。axis=1表示删除的是列,结果如下:

  姓名  年龄  成绩
0  张三  25  80
1  李四  30  90
2  王五  35  85
3  赵六  28  95
  1. 使用列表删除多个列
# 删除多个列
df_drop_multi = df.drop(['年龄', '成绩'], axis=1)

print(df_drop_multi)

以上代码中,我们使用drop方法删除了DataFrame中的'年龄'和'成绩'两列,并将结果保存在新的DataFrame df_drop_multi中,结果如下:

  姓名 性别
0  张三  男
1  李四  女
2  王五  男
3  赵六  女
  1. 直接使用列表索引删除多个列
# 直接使用列表索引删除多个列
df_drop_iat = df[df.columns[[0, 2]]]

print(df_drop_iat)

以上代码中,我们使用DataFrame的columns属性和列表索引的方式删除了DataFrame中的'姓名'和'年龄'两列,并将结果保存在新的DataFrame df_drop_iat中,结果如下:

  姓名  年龄
0  张三  25
1  李四  30
2  王五  35
3  赵六  28

三、通过以上示例,我们学习了在使用Pandas中删除DataFrame中特定列的不同方法和技巧。这些方法的选择取决于实际需求以及个人偏好。

总结:

  1. 使用drop方法删除单个或多个列,需要指定axis=1表示删除的是列。
  2. 使用列表索引的方式删除多个列,可以直接通过df.columns
  3. rrreee
  4. Dalam kod di atas, kami menggunakan kaedah drop untuk memadamkan lajur 'jantina' dalam DataFrame dan simpan hasilnya dalam Dalam DataFrame baharu df_drop. axis=1 bermakna lajur dipadamkan Hasilnya adalah seperti berikut:
  5. rrreee
      Gunakan senarai untuk memadam berbilang lajur

      rrreee🎜Dalam kod di atas, kami menggunakan drop Kaedah memadamkan lajur 'umur' dan 'gred' dalam DataFrame dan menyimpan keputusan dalam DataFrame df_drop_multi Hasilnya adalah seperti berikut: 🎜rrreee
        🎜Gunakan indeks senarai secara langsung untuk memadam berbilang lajur🎜🎜rrreee🎜Dalam kod di atas, kami menggunakan atribut lajur DataFrame dan indeks senarai untuk memadamkan 'nama' dan lajur 'umur' dalam DataFrame , dan simpan hasilnya dalam DataFrame df_drop_iat baharu, hasilnya adalah seperti berikut: 🎜rrreee🎜 3. Melalui contoh di atas, kami telah mempelajari kaedah dan teknik yang berbeza untuk memadam lajur tertentu dalam DataFrame menggunakan Pandas. Pilihan kaedah ini bergantung kepada keperluan praktikal serta keutamaan peribadi. 🎜🎜Ringkasan: 🎜🎜🎜Gunakan kaedah drop untuk memadamkan satu atau berbilang lajur Anda perlu menentukan axis=1 untuk menunjukkan bahawa lajur sedang dipadamkan. 🎜🎜Gunakan indeks senarai untuk memadamkan berbilang lajur Anda boleh terus memilih lajur yang perlu dikekalkan melalui sifat df.columns. 🎜🎜Apabila memadamkan lajur, DataFrame asal tidak diubah suai, tetapi DataFrame baharu dikembalikan. 🎜🎜🎜Melalui operasi fleksibel dan fungsi kaya yang disediakan oleh Pandas, kami boleh memproses dan mengurus data dalam DataFrame dengan mudah untuk memenuhi keperluan analisis dan pemprosesan data yang berbeza. 🎜

    Atas ialah kandungan terperinci Teknik pemprosesan data untuk memadamkan lajur tertentu dalam DataFrame menggunakan Panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

    Kenyataan:
    Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn