Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Cara membaca dan memanipulasi data CSV menggunakan perpustakaan panda Python

Cara membaca dan memanipulasi data CSV menggunakan perpustakaan panda Python

WBOY
WBOYasal
2024-01-13 08:20:071317semak imbas

Cara membaca dan memanipulasi data CSV menggunakan perpustakaan panda Python

Cara menggunakan panda untuk membaca fail CSV dan melakukan pemprosesan data

pandas ialah alat pemprosesan dan analisis data yang berkuasa yang menyediakan fungsi untuk membaca, memanipulasi dan menganalisis data dalam pelbagai format. Dalam artikel ini, kami akan memperkenalkan cara membaca fail CSV dan melakukan pemprosesan data menggunakan panda.

Pertama, pastikan anda telah memasang perpustakaan panda. Jika ia belum dipasang, anda boleh memasangnya dengan menjalankan arahan berikut dalam terminal:

pip install pandas

Seterusnya, kami akan menunjukkan menggunakan contoh fail CSV berikut:

name,age,city
John,30,New York
Alice,25,Los Angeles
Bob,35,Chicago

Sekarang, mari kita mula menulis kod untuk membaca fail dan memproses data.

Mula-mula, import perpustakaan panda:

import pandas as pd

Kemudian, baca fail CSV menggunakan fungsi read_csv(): read_csv()函数读取CSV文件:

df = pd.read_csv('data.csv')

这将创建一个名为df的pandas DataFrame对象来存储CSV文件的内容。

如果你想查看读取的数据,可以使用head()函数来显示前几行数据:

print(df.head())

接下来,让我们介绍一些常用的数据处理操作。

  1. 选择列:
    要选择特定的列,可以使用列名称作为索引:
name_column = df['name']
age_column = df['age']
  1. 选择行:
    要选择特定的行,可以使用lociloc函数:
row_0 = df.loc[0]  # 使用索引选择第一行数据
row_1 = df.iloc[1]  # 使用位置选择第二行数据
  1. 筛选数据:
    可以使用条件来筛选满足特定条件的数据:
filtered_data = df[df['age'] > 30]  # 筛选年龄大于30的数据
  1. 添加列:
    可以使用insert()函数添加新的列:
df.insert(3, 'country', ['USA', 'USA', 'USA'])  # 添加一个名为'country'的列,所有行的值都是'USA'
  1. 删除列:
    要删除列,使用drop()函数:
df = df.drop('city', axis=1)  # 删除名为'city'的列
  1. 修改数据:
    要修改数据,可以使用索引或条件进行选择并重新赋值:
df.loc[0, 'age'] = 31  # 修改第一行'age'列的值为31
df['age'] = df['age'] + 1  # 将'age'列的所有值加1

这些只是pandas提供的许多数据处理操作中的一部分。根据你的具体需求,还可以执行其他操作,如排序数据、合并数据和计算统计信息等。

最后,将数据保存到新的CSV文件中,可以使用to_csv()

df.to_csv('new_data.csv', index=False)  # 将数据保存到名为'new_data.csv'的文件中,不包含行索引

Ini akan mencipta DataFrame panda bernama df Objek untuk menyimpan kandungan fail CSV.

Jika anda ingin melihat data yang dibaca, anda boleh menggunakan fungsi head() untuk memaparkan beberapa baris pertama data:

rrreee

Seterusnya, izinkan kami memperkenalkan beberapa operasi pemprosesan data biasa. 🎜
  1. Pilih lajur:
    Untuk memilih lajur tertentu, anda boleh menggunakan nama lajur sebagai indeks:
rrreee
  1. Pilih baris:Untuk memilih baris tertentu, anda boleh menggunakan fungsi loc atau iloc:
rrreee
  1. Tapis Data:
    Anda boleh menggunakan syarat untuk menapis data yang memenuhi syarat tertentu:
rrreee
  1. Tambah lajur:
    Anda boleh menggunakan insert() Fungsi untuk menambah lajur baharu:
rrreee
  1. Padam lajur:
    Untuk memadam lajur, gunakan drop()Fungsi:
rrreee
  1. Ubah suai data:
    Untuk mengubah suai data, anda boleh menggunakan indeks atau syarat untuk memilih dan tetapkan semula:
  2. ol>rrreee🎜Ini hanyalah sebahagian daripada banyak operasi pemprosesan data yang disediakan oleh panda. Bergantung pada keperluan khusus anda, anda juga boleh melakukan operasi lain seperti mengisih data, menggabungkan data dan mengira statistik. 🎜🎜Akhir sekali, untuk menyimpan data ke fail CSV baharu, anda boleh menggunakan fungsi to_csv(): 🎜rrreee🎜Ini ialah kaedah asas dan beberapa operasi biasa menggunakan panda untuk membaca fail CSV dan melaksanakan pemprosesan data. Dengan operasi ini, anda boleh memproses dan menganalisis data dengan mudah dalam pelbagai format yang berbeza. 🎜🎜Saya harap artikel ini membantu anda dan saya doakan anda berjaya dalam pemprosesan data dan perjalanan analisis anda! 🎜

Atas ialah kandungan terperinci Cara membaca dan memanipulasi data CSV menggunakan perpustakaan panda Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn