Rumah >pembangunan bahagian belakang >Tutorial Python >Penjelasan terperinci tentang cara Python menggunakan Panda untuk analisis data

Penjelasan terperinci tentang cara Python menggunakan Panda untuk analisis data

WBOY
WBOYke hadapan
2022-09-06 17:30:013802semak imbas

[Cadangan berkaitan: Tutorial video Python3 ]

Panda ialah yang paling popular untuk analisis data Python perpustakaan. Ia menawarkan prestasi yang sangat dioptimumkan, dengan kod sumber bahagian belakang ditulis sepenuhnya dalam C atau Python.

Kami boleh menganalisis data dalam panda dengan cara berikut:

  • 1.Siri

  • 2 >

Siri

Siri ialah tatasusunan satu dimensi (1-D) yang ditakrifkan dalam panda dan boleh digunakan untuk menyimpan sebarang jenis data.

Kod #1

Cipta Siri

# 创建 Series 的程序

# 导入 Panda 库
import pandas as pd

# 使用数据和索引创建 Series
a = pd.Series(Data, index = Index)
Di sini,

data boleh menjadi:

    A
  • nilai skalar, yang boleh menjadi integerValue, rentetan
  • yang boleh menjadi pasangan nilai kunci
  • Kamus Python
  • a
  • >Ndarray

Nota: Secara lalai, indeks bermula dari 0, 1, 2, ...(n-1), di mana n ialah panjang data.

Kod #2

Apabila Data mengandungi nilai skalar

# 使用标量值创建 Series 的程序

# 数值数据
Data =[1, 3, 4, 5, 6, 2, 9]

# 使用默认索引值创建系列
s = pd.Series(Data)	

# 预定义的索引值
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g']

# 创建具有预定义索引值的系列
si = pd.Series(Data, Index)

Output:

Data skalar dengan indeks lalai

Data skalar dengan indeks

Kod #3

Apabila data mengandungi kamus

# 创建词典 Series 程序
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}

# 创建字典类型 Series
sd = pd.Series(dictionary)

Output:

Data jenis kamus

Kod #4

Apabila Data mengandungi Ndarray

# 创建 ndarray series 的程序

# 定义二维数组
Data =[[2, 3, 4], [5, 6, 7]]

# 创建一系列二维数组
snd = pd.Series(Data)

Output:

Data sebagai Ndarray

Bingkai Data

DataFrames ialah struktur data dua dimensi (2-D) yang ditakrifkan dalam panda, terdiri daripada baris dan lajur.

Kod #1

Buat DataFrame

# 创建 DataFrame 的程序

# 导入库
import pandas as pd

# 使用数据创建 DataFrame
a = pd.DataFrame(Data)
Di sini, data boleh menjadi:

    A atau berbilang
  • kamus
  • satu atau lebih
  • Siri
  • 2D-numpy Ndarray
Kod #2

Apabila data ialah kamus

# 使用两个字典创建数据框的程序

# 定义字典 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}

# 定义字典 2
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9}

# 用 dict1 和 dict2 定义数据
Data = {'first':dict1, 'second':dict2}

# 创建数据框
df = pd.DataFrame(Data)

Output:

DataFrame dengan dua kamus

Kod #3

Apabila data adalah Siri

# 创建三个系列的Dataframe的程序
import pandas as pd

# 定义 series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])

# 定义 series 2
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3])

# 定义 series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e'])	

# 定义 Data
Data ={'first':s1, 'second':s2, 'third':s3}

# 创建 DataFrame
dfseries = pd.DataFrame(Data)

Output :

DataFrame of three Series

Kod #4

Apabila Data 2D-numpy ndarrayNota: Satu kekangan mesti dikekalkan semasa membuat DataFrame tatasusunan 2D - dimensi tatasusunan 2D mestilah sama.

# 从二维数组创建 DataFrame 的程序

# 导入库
import pandas as pd

# 定义 2d 数组 1
d1 =[[2, 3, 4], [5, 6, 7]]

# 定义 2d 数组 2
d2 =[[2, 4, 8], [1, 3, 9]]

# 定义 Data
Data ={'first': d1, 'second': d2}

# 创建 DataFrame
df2d = pd.DataFrame(Data)

Output:

DataFrame dengan ndarray 2d

[Cadangan berkaitan:

Python tutorial video ]

Atas ialah kandungan terperinci Penjelasan terperinci tentang cara Python menggunakan Panda untuk analisis data. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:jb51.net. Jika ada pelanggaran, sila hubungi admin@php.cn Padam