Rumah >pembangunan bahagian belakang >Tutorial Python >Penjelasan terperinci tentang pengenalan dan penggunaan fungsi yang biasa digunakan dalam perpustakaan panda

Penjelasan terperinci tentang pengenalan dan penggunaan fungsi yang biasa digunakan dalam perpustakaan panda

WBOY
WBOYasal
2024-01-24 10:19:171451semak imbas

Penjelasan terperinci tentang pengenalan dan penggunaan fungsi yang biasa digunakan dalam perpustakaan panda

Pengenalan fungsi umum perpustakaan panda dan penggunaan terperinci

Pengenalan:

pandas ialah alat analisis dan operasi data sumber terbuka, fleksibel dan cekap, yang digunakan secara meluas dalam sains data, pembelajaran mesin, kewangan, statistik dan bidang lain . Artikel ini akan memperkenalkan fungsi yang biasa digunakan dan penggunaannya dalam perpustakaan panda, dengan harapan dapat membantu pembaca memahami dan menggunakan panda dengan lebih baik.

1. Pengenalan kepada struktur data

  1. Siri (jujukan)

Siri ialah salah satu struktur data paling asas dalam panda Ia adalah jenis data satu dimensi yang boleh mengandungi sebarang jenis data (integer, nombor titik terapung , rentetan, dsb.). Kaedah penciptaan adalah seperti berikut:

import pandas as pd

data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s)

Hasil keluaran:

0    1
1    2
2    3
3    4
4    5
dtype: int64
  1. DataFrame (bingkai data)

DataFrame ialah struktur data yang paling biasa digunakan dalam panda Ia adalah struktur data jadual dua dimensi yang boleh dianggap sebagai struktur data jadual terdiri daripada beberapa Terdiri daripada Siri. Kaedah penciptaan adalah seperti berikut:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie'],
        'age': [25, 30, 35],
        'city': ['New York', 'London', 'Tokyo']}
df = pd.DataFrame(data)
print(df)

Hasil keluaran:

      name  age      city
0    Alice   25  New York
1      Bob   30    London
2  Charlie   35     Tokyo

2. Pengenalan dan penggunaan terperinci fungsi biasa

  1. head() dan tail()

head() fungsi digunakan untuk melihat beberapa baris pertama daripada DataFrame, dan paparan lalai adalah sebelum 5 baris fungsi tail() digunakan untuk melihat beberapa baris terakhir DataFrame, dan 5 baris terakhir dilihat secara lalai. Kod sampel adalah seperti berikut:

import pandas as pd

df = pd.read_csv('data.csv')
print(df.head())
print(df.tail())
  1. atribut bentuk

atribut bentuk mengembalikan bentuk DataFrame, iaitu bilangan baris dan lajur. Kod sampel adalah seperti berikut: Fungsi

import pandas as pd

df = pd.read_csv('data.csv')
print(df.shape)
  1. info()

info() digunakan untuk melihat maklumat keseluruhan DataFrame, termasuk nama lajur, bilangan nilai bukan nol, jenis data, dsb. Kod sampel adalah seperti berikut:

import pandas as pd

df = pd.read_csv('data.csv')
print(df.info())
  1. describe() function

describe() fungsi digunakan untuk mengira maklumat statistik lajur berangka dalam DataFrame, seperti kiraan, min, sisihan piawai, nilai minimum, nilai maksimum, dsb. . Kod sampel adalah seperti berikut: Fungsi

import pandas as pd

df = pd.read_csv('data.csv')
print(df.describe())
  1. sort_values()

sort_values() digunakan untuk mengisih DataFrame berdasarkan nilai lajur yang ditentukan. Kod sampel adalah seperti berikut: Fungsi

import pandas as pd

df = pd.read_csv('data.csv')
df_sorted = df.sort_values(by='age', ascending=False)  # 按照age列的值进行降序排序
print(df_sorted)
  1. groupby()

groupby() digunakan untuk mengumpulkan mengikut lajur yang ditentukan dan mengagregatkan hasil terkumpul. Kod sampel adalah seperti berikut: Fungsi

import pandas as pd

df = pd.read_csv('data.csv')
grouped = df.groupby('city')
mean_age = grouped['age'].mean()  # 计算每个城市的平均年龄
print(mean_age)
  1. merge()

fungsi merge() digunakan untuk menggabungkan dua DataFrames mengikut lajur yang ditentukan. Kod sampel adalah seperti berikut:

import pandas as pd

df1 = pd.DataFrame({'A': [1, 2, 3],
                    'B': ['a', 'b', 'c']})
df2 = pd.DataFrame({'A': [2, 3, 4],
                    'C': ['x', 'y', 'z']})
merged = pd.merge(df1, df2, on='A')  # 按照列A合并
print(merged)
  1. apply() function

apply() fungsi digunakan untuk menggunakan fungsi tersuai pada setiap elemen dalam DataFrame. Kod sampel adalah seperti berikut:

import pandas as pd

df = pd.read_csv('data.csv')

# 定义一个自定义函数:将年龄加上10
def add_ten(age):
    return age + 10

df['age'] = df['age'].apply(add_ten)  # 对age列的每个元素应用add_ten函数
print(df)

Kesimpulan:

Artikel ini memperkenalkan secara ringkas fungsi pustaka panda yang biasa digunakan dan penggunaannya, termasuk operasi asas Siri dan DataFrame, statistik data, pengisihan, pengelompokan, penggabungan dan aplikasi fungsi tersuai , dsb. Kami berharap pengenalan artikel ini dapat membantu pembaca lebih memahami dan menggunakan perpustakaan panda serta memainkan peranan yang lebih besar dalam analisis dan pemprosesan data.

Atas ialah kandungan terperinci Penjelasan terperinci tentang pengenalan dan penggunaan fungsi yang biasa digunakan dalam perpustakaan panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn