Maison >développement back-end >Tutoriel Python >Explication détaillée de la façon dont Python utilise Pandas pour l'analyse des données

Explication détaillée de la façon dont Python utilise Pandas pour l'analyse des données

WBOY
WBOYavant
2022-09-06 17:30:013803parcourir

【Recommandation associée : Tutoriel vidéo Python3

Pandas est la bibliothèque Python la plus populaire pour l'analyse de données. Il offre des performances hautement optimisées, avec un code source backend entièrement écrit en C ou Python.

Nous pouvons analyser les données des pandas des manières suivantes :

  • 1.Series

  • 2.Data Frame

Series

Series est une dimension unidimensionnelle (1-D) définie dans Les tableaux pandas peuvent être utilisés pour stocker n’importe quel type de données.

CODE # 1

Create Series

# 创建 Series 的程序

# 导入 Panda 库
import pandas as pd

# 使用数据和索引创建 Series
a = pd.Series(Data, index = Index)

here, Data peut être:

  • a scalar valeur, qui peut être entier
  • A Ndarray
  • Remarque
 : Par défaut, l'index commence à 0, 1, 2, ...(n-1), où n est la longueur des données.

Code #2

Lorsque les données contiennent des valeurs scalaires

# 使用标量值创建 Series 的程序

# 数值数据
Data =[1, 3, 4, 5, 6, 2, 9]

# 使用默认索引值创建系列
s = pd.Series(Data)	

# 预定义的索引值
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g']

# 创建具有预定义索引值的系列
si = pd.Series(Data, Index)
Sortie

 :

Données scalaires avec index par défaut

Données scalaires avec index

Code #3

Lorsque les données contiennent un dictionnaire

# 创建词典 Series 程序
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}

# 创建字典类型 Series
sd = pd.Series(dictionary)
Sortie

 :

Données de type dictionnaire

Code #4

Lorsque les données contiennent Ndarray

# 创建 ndarray series 的程序

# 定义二维数组
Data =[[2, 3, 4], [5, 6, 7]]

# 创建一系列二维数组
snd = pd.Series(Data)
Sortie

 :

Données comme Ndarray

DataFrame

DataFrames

est une structure de données bidimensionnelle (2D) définie dans les pandas, composée de lignes et de colonnes.

Code #1

Créer un DataFrame

# 创建 DataFrame 的程序

# 导入库
import pandas as pd

# 使用数据创建 DataFrame
a = pd.DataFrame(Data)
Ici, les données peuvent être :

Un ou plusieurs

Dictionnaires
  • Une ou plusieurs Séries
  • 2D-numpy rayon
  • Code #2

Quand les données sont un dictionnaire

# 使用两个字典创建数据框的程序

# 定义字典 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}

# 定义字典 2
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9}

# 用 dict1 和 dict2 定义数据
Data = {'first':dict1, 'second':dict2}

# 创建数据框
df = pd.DataFrame(Data)
Sortie

 :

DataFrame avec deux dictionnaires

Code #3

Quand les données sont une série

# 创建三个系列的Dataframe的程序
import pandas as pd

# 定义 series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])

# 定义 series 2
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3])

# 定义 series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e'])	

# 定义 Data
Data ={'first':s1, 'second':s2, 'third':s3}

# 创建 DataFrame
dfseries = pd.DataFrame(Data)
Sortie

 :

DataFrame de trois séries

Code #4

Lorsque les données sont un ndarray 2D-numpy

Remarque : Une contrainte doit être maintenue lors de la création d'un DataFrame d'un tableau 2D - les dimensions du tableau 2D doivent être le même.

# 从二维数组创建 DataFrame 的程序

# 导入库
import pandas as pd

# 定义 2d 数组 1
d1 =[[2, 3, 4], [5, 6, 7]]

# 定义 2d 数组 2
d2 =[[2, 4, 8], [1, 3, 9]]

# 定义 Data
Data ={'first': d1, 'second': d2}

# 创建 DataFrame
df2d = pd.DataFrame(Data)
Sortie

 :

DataFrame avec ndarray 2D

【Recommandation associée :

Tutoriel vidéo Python3

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer