Rumah >pembangunan bahagian belakang >Tutorial Python >Penjelasan terperinci tentang cara Python menggunakan Panda untuk analisis data
[Cadangan berkaitan: Tutorial video Python3 ]
Panda ialah yang paling popular untuk analisis data Python perpustakaan. Ia menawarkan prestasi yang sangat dioptimumkan, dengan kod sumber bahagian belakang ditulis sepenuhnya dalam C atau Python.
Kami boleh menganalisis data dalam panda dengan cara berikut:
1.Siri
2 >
Siri ialah tatasusunan satu dimensi (1-D) yang ditakrifkan dalam panda dan boleh digunakan untuk menyimpan sebarang jenis data.
Kod #1Cipta Siri
# 创建 Series 的程序 # 导入 Panda 库 import pandas as pd # 使用数据和索引创建 Series a = pd.Series(Data, index = Index)Di sini,
data boleh menjadi:
Nota: Secara lalai, indeks bermula dari 0, 1, 2, ...(n-1), di mana n ialah panjang data.
Kod #2Apabila Data mengandungi nilai skalar
# 使用标量值创建 Series 的程序 # 数值数据 Data =[1, 3, 4, 5, 6, 2, 9] # 使用默认索引值创建系列 s = pd.Series(Data) # 预定义的索引值 Index =['a', 'b', 'c', 'd', 'e', 'f', 'g'] # 创建具有预定义索引值的系列 si = pd.Series(Data, Index)
Output:
Data skalar dengan indeks lalai Data skalar dengan indeksKod #3Apabila data mengandungi kamus
# 创建词典 Series 程序 dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5} # 创建字典类型 Series sd = pd.Series(dictionary)
Output:
Data jenis kamusKod #4
Apabila Data mengandungi Ndarray
# 创建 ndarray series 的程序 # 定义二维数组 Data =[[2, 3, 4], [5, 6, 7]] # 创建一系列二维数组 snd = pd.Series(Data)
Output:
Data sebagai NdarrayBingkai DataDataFrames ialah struktur data dua dimensi (2-D) yang ditakrifkan dalam panda, terdiri daripada baris dan lajur.
Kod #1Buat DataFrame
# 创建 DataFrame 的程序 # 导入库 import pandas as pd # 使用数据创建 DataFrame a = pd.DataFrame(Data)Di sini, data boleh menjadi:
Apabila data ialah kamus
# 使用两个字典创建数据框的程序 # 定义字典 1 dict1 ={'a':1, 'b':2, 'c':3, 'd':4} # 定义字典 2 dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9} # 用 dict1 和 dict2 定义数据 Data = {'first':dict1, 'second':dict2} # 创建数据框 df = pd.DataFrame(Data)
Output:
DataFrame dengan dua kamusKod #3Apabila data adalah Siri
# 创建三个系列的Dataframe的程序 import pandas as pd # 定义 series 1 s1 = pd.Series([1, 3, 4, 5, 6, 2, 9]) # 定义 series 2 s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3]) # 定义 series 3 s3 = pd.Series(['a', 'b', 'c', 'd', 'e']) # 定义 Data Data ={'first':s1, 'second':s2, 'third':s3} # 创建 DataFrame dfseries = pd.DataFrame(Data)
Output :
DataFrame of three SeriesKod #4Apabila Data 2D-numpy ndarrayNota: Satu kekangan mesti dikekalkan semasa membuat DataFrame tatasusunan 2D - dimensi tatasusunan 2D mestilah sama.
# 从二维数组创建 DataFrame 的程序 # 导入库 import pandas as pd # 定义 2d 数组 1 d1 =[[2, 3, 4], [5, 6, 7]] # 定义 2d 数组 2 d2 =[[2, 4, 8], [1, 3, 9]] # 定义 Data Data ={'first': d1, 'second': d2} # 创建 DataFrame df2d = pd.DataFrame(Data)
Output:
DataFrame dengan ndarray 2d[Cadangan berkaitan:Python tutorial video ]
Atas ialah kandungan terperinci Penjelasan terperinci tentang cara Python menggunakan Panda untuk analisis data. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!