Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Panduan permulaan pantas untuk fungsi yang biasa digunakan dalam perpustakaan panda

Panduan permulaan pantas untuk fungsi yang biasa digunakan dalam perpustakaan panda

WBOY
WBOYasal
2024-01-24 08:05:05855semak imbas

Panduan permulaan pantas untuk fungsi yang biasa digunakan dalam perpustakaan panda

Pustaka panda ialah alat pemprosesan dan analisis data yang biasa digunakan dalam Python Ia menyediakan pelbagai fungsi dan kaedah yang boleh melengkapkan import, pembersihan, pemprosesan, analisis dan visualisasi data dengan mudah. Artikel ini akan memperkenalkan panduan permulaan pantas kepada fungsi yang biasa digunakan dalam pustaka panda, dengan contoh kod khusus.

  1. Import data
    pustaka panda boleh mengimport fail data dengan mudah dalam pelbagai format melalui read_csv, read_excel dan fungsi lain. Berikut ialah contoh kod:
import pandas as pd

# 从csv文件中导入数据
data = pd.read_csv('data.csv')

# 从excel文件中导入数据
data = pd.read_excel('data.xlsx')
  1. Melihat data
    Pustaka panda menyediakan kepala, ekor dan fungsi lain untuk melihat beberapa baris pertama dan terakhir data. Berikut ialah kod sampel:
# 查看数据的前5行
print(data.head())

# 查看数据的后5行
print(data.tail())
  1. Pembersihan Data
    Perpustakaan panda menyediakan fungsi seperti dropna dan fillna untuk mengendalikan nilai yang hilang, serta fungsi seperti menggantikan untuk menggantikan nilai tertentu. Berikut ialah kod sampel:
# 删除含有缺失值的行
data = data.dropna()

# 使用均值填充缺失值
data = data.fillna(data.mean())

# 将特定的值替换为其他值
data['column_name'] = data['column_name'].replace('old_value', 'new_value')
  1. Penghirisan dan penapisan data
    Perpustakaan panda melaksanakan penghirisan dan penapisan data melalui fungsi seperti iloc dan loc. Berikut ialah kod sampel:
# 使用位置索引切片
subset = data.iloc[1:10, 2:5]

# 使用标签索引切片
subset = data.loc[data['column_name'] == 'value']

# 使用条件筛选
subset = data[data['column_name'] > 10]
  1. Pengisihan dan pemeringkatan data
    Pustaka panda menyediakan fungsi seperti sort_values ​​​​dan sort_index untuk melaksanakan operasi pengisihan dan pemeringkatan data. Berikut ialah kod sampel:
# 按列进行排序
data = data.sort_values('column_name')

# 按索引进行排序
data = data.sort_index()

# 对列进行排名
data['column_rank'] = data['column_name'].rank()
  1. Pengagregatan dan pengiraan data
    Perpustakaan panda menyediakan kumpulan mengikut, agg dan fungsi lain untuk melaksanakan pengagregatan dan pengiraan data. Berikut ialah kod sampel:
# 对列进行聚合操作
grouped_data = data.groupby('column_name').sum()

# 对多列进行聚合操作
grouped_data = data.groupby(['column_name1', 'column_name2']).mean()

# 对列进行自定义的聚合操作
aggregated_data = data.groupby('column_name').agg({'column_name': 'mean', 'column_name2': 'sum'})
  1. Penggambaran Data
    Perpustakaan panda menyediakan fungsi plot untuk menggambarkan data. Berikut ialah contoh kod:
# 绘制折线图
data.plot(x='column_name', y='column_name2', kind='line')

# 绘制散点图
data.plot(x='column_name', y='column_name2', kind='scatter')

# 绘制柱状图
data.plot(x='column_name', y='column_name2', kind='bar')

Artikel ini memperkenalkan secara ringkas beberapa fungsi yang biasa digunakan dalam perpustakaan panda, serta contoh kod khusus yang sepadan. Dengan mempelajari dan menguasai penggunaan fungsi ini, kami boleh memproses dan menganalisis data dengan lebih cekap. Sudah tentu, perpustakaan panda mempunyai fungsi yang lebih berkuasa menunggu semua orang menemui dan memohon. Jika anda berminat untuk mengetahui lebih lanjut tentang perpustakaan panda, anda boleh menyemak dokumentasi rasmi atau tutorial berkaitan dan kod sampel.

Atas ialah kandungan terperinci Panduan permulaan pantas untuk fungsi yang biasa digunakan dalam perpustakaan panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn