Maison >développement back-end >Tutoriel Python >Explication détaillée de la façon dont Python utilise Pandas pour l'analyse des données
【Recommandation associée : Tutoriel vidéo Python3】
Pandas est la bibliothèque Python la plus populaire pour l'analyse de données. Il offre des performances hautement optimisées, avec un code source backend entièrement écrit en C ou Python.
Nous pouvons analyser les données des pandas des manières suivantes :
1.Series
2.Data Frame
Series est une dimension unidimensionnelle (1-D) définie dans Les tableaux pandas peuvent être utilisés pour stocker n’importe quel type de données.
Create Series
# 创建 Series 的程序 # 导入 Panda 库 import pandas as pd # 使用数据和索引创建 Series a = pd.Series(Data, index = Index)
here, Data peut être:
Code #2
# 使用标量值创建 Series 的程序 # 数值数据 Data =[1, 3, 4, 5, 6, 2, 9] # 使用默认索引值创建系列 s = pd.Series(Data) # 预定义的索引值 Index =['a', 'b', 'c', 'd', 'e', 'f', 'g'] # 创建具有预定义索引值的系列 si = pd.Series(Data, Index)Sortie :
Données scalaires avec index par défaut
Données scalaires avec index
Code #3
# 创建词典 Series 程序 dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5} # 创建字典类型 Series sd = pd.Series(dictionary)Sortie :
Données de type dictionnaire
Code #4# 创建 ndarray series 的程序 # 定义二维数组 Data =[[2, 3, 4], [5, 6, 7]] # 创建一系列二维数组 snd = pd.Series(Data)Sortie :
Données comme Ndarray
DataFrameCode #1
# 创建 DataFrame 的程序 # 导入库 import pandas as pd # 使用数据创建 DataFrame a = pd.DataFrame(Data)Ici, les données peuvent être :
Un ou plusieurs
Dictionnaires# 使用两个字典创建数据框的程序 # 定义字典 1 dict1 ={'a':1, 'b':2, 'c':3, 'd':4} # 定义字典 2 dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9} # 用 dict1 和 dict2 定义数据 Data = {'first':dict1, 'second':dict2} # 创建数据框 df = pd.DataFrame(Data)Sortie :
DataFrame avec deux dictionnaires
Code #3# 创建三个系列的Dataframe的程序 import pandas as pd # 定义 series 1 s1 = pd.Series([1, 3, 4, 5, 6, 2, 9]) # 定义 series 2 s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3]) # 定义 series 3 s3 = pd.Series(['a', 'b', 'c', 'd', 'e']) # 定义 Data Data ={'first':s1, 'second':s2, 'third':s3} # 创建 DataFrame dfseries = pd.DataFrame(Data)Sortie :
DataFrame de trois séries
Code #4Remarque : Une contrainte doit être maintenue lors de la création d'un DataFrame d'un tableau 2D - les dimensions du tableau 2D doivent être le même.
# 从二维数组创建 DataFrame 的程序 # 导入库 import pandas as pd # 定义 2d 数组 1 d1 =[[2, 3, 4], [5, 6, 7]] # 定义 2d 数组 2 d2 =[[2, 4, 8], [1, 3, 9]] # 定义 Data Data ={'first': d1, 'second': d2} # 创建 DataFrame df2d = pd.DataFrame(Data)Sortie :
DataFrame avec ndarray 2D
【Recommandation associée :Tutoriel vidéo Python3
】Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!