Maison  >  Article  >  développement back-end  >  Quelle est la différence entre les trames de données et les matrices dans Python Pandas ?

Quelle est la différence entre les trames de données et les matrices dans Python Pandas ?

WBOY
WBOYavant
2023-09-14 19:53:021175parcourir

在Python Pandas中,数据帧(data frames)和矩阵(matrices)之间的区别是什么?

Dans cet article, nous allons vous montrer la différence entre dataframe et matrice en python panda.

Les trames de données et les matrices sont toutes deux des structures de données bidimensionnelles. De manière générale, une trame de données peut contenir plusieurs types de données (nombres, caractères, facteurs, etc.), tandis qu'une matrice ne peut stocker qu' un type de données.

Cadres de données en Python

En Python, DataFrame est une structure de données bidimensionnelle, tabulaire et mutable qui peut stocker des données tabulaires contenant des objets de différents types de données. DataFrame a des axes étiquetés en lignes et en colonnes. Les DataFrames sont des outils utiles dans le prétraitement des données car ils fournissent des méthodes de traitement de données précieuses. DataFrame peut également être utilisé pour créer des tableaux croisés dynamiques et tracer des données à l'aide de Matplotlib.

Application Dataframe

  • Les trames de données peuvent effectuer diverses tâches telles que l'ajustement de formules statistiques.

  • Traitement des données (La matrice n'est pas possible, doit d'abord être convertie en trame de données)

  • Convertissez les lignes en colonnes et vice versa, très utile en science des données.

Créer un exemple de bloc de données

Algorithme (étapes)

Voici les algorithmes/étapes à suivre pour effectuer la tâche requise -

  • Utilisez le mot-clé import pour importer les modules pandas, numpy avec des alias.

  • Utilisez la fonction DataFrame() du module pandas pour créer un bloc de données.

  • Imprimez le bloc de données d'entrée.

Exemple

Le programme suivant utilise la fonction DataFrame() pour renvoyer une trame de données -

# importing pandas, numpy modules with alias names
import pandas as pd
import numpy as np

# creating a dataframe
inputDataframe = pd.DataFrame({'Name': ['Virat', 'Rohit', 'Meera', 'Nick', 'Sana'], 'Jobrole': ['Developer', 'Analyst', 'Help Desk', 'Database Developer', 'Finance accountant'], 'Age': [25, 30, 28, 25, 40]})

# displaying the dataframe
print(inputDataframe)

Sortie

Une fois exécuté, le programme ci-dessus générera le résultat suivant -

   Name             Jobrole      Age
0  Virat            Developer    25
1  Rohit            Analyst      30
2  Meera            Help Desk    28
3  Nick  Database   Developer    25
4  Sana  Finance    accountant   40

Matrice en Python

Une matrice est une collection d'ensembles de données homogènes organisés dans une grille rectangulaire bidimensionnelle. Il s'agit d'un tableau m*n avec le même type de données. Il est créé avec une entrée vectorielle. Il existe un nombre fixe de lignes et de colonnes. Python prend en charge diverses opérations arithmétiques telles que l'addition, la soustraction, la multiplication et la division sur Matrix.

Application de la matrice

  • Il est très utile en économie pour calculer des statistiques telles que le PIB (produit intérieur brut) ou le PI (prix par habitant).

  • Il est également utile pour étudier les circuits électriques et électroniques.

  • Imprimez le bloc de données d'entrée.

  • Matrix est utilisé pour la recherche, comme dessiner des graphiques.

  • Ceci est utile en probabilités et en statistiques.

Multiplication de matrice en convertissant la matrice en bloc de données

Algorithme (étapes)

Voici les algorithmes/étapes à suivre pour effectuer la tâche requise -

  • Utilisez le mot-clé import pour importer le module pandas avec un alias.

  • Créez deux variables pour stocker respectivement les deux matrices d'entrée.

  • Créez des dataframes pour les première et deuxième matrices à l'aide de la fonction DataFrame() (Create DataFrame) du module pandas et stockez-les dans des variables séparées. Ces données sont chargées dans les Pandas DataFrames.

  • Imprimez le bloc de données de la matrice d'entrée 1.

  • Imprimez les dimensions (forme) de la matrice d'entrée 1 en appliquant l'attribut shape.

  • Imprimez la trame de données de la matrice d'entrée 2.

  • Imprimez les dimensions (forme) de la matrice d'entrée 2 en appliquant l'attribut shape.

  • Utilisez la fonction dot() pour multiplier les matrices inputMatrix_1 et inputMatrix_2 et créez une variable pour la stocker.

  • Imprimez la matrice résultat de la multiplication des matrices inputMatrix_1 et inputMatrix_2.

  • Imprimez les dimensions (forme) de la matrice résultante en appliquant l'attribut shape.

Exemple

Le programme suivant utilise la fonction DataFrame() pour renvoyer une trame de données -

# importing pandas module
import pandas as pd

# input matrix 1
inputMatrix_1 = [[1, 2, 2],
   [1,  2, 0],
   [1,  0, 2]]

# input matrix 2
inputMatrix_2 = [[1, 0, 1],
   [2, 1, 1],
   [2, 1, 2]]

# creating a dataframe of first matrix
#(here data is loaded into a pandas DataFrames)
df_1 = pd.DataFrame(data=inputMatrix_1)

# creating a dataframe of second matrix
df_2 = pd.DataFrame(data=inputMatrix_2)

# printing the dataframe of input matrix 1
print("inputMatrix_1:")
print(df_1)

# printing the dimensions(shape) of input matrix 1
print("The dimensions(shape) of input matrix 1:")
print(df_1.shape)
print()

# printing the dataframe of input matrix 2
print("inputMatrix_2:")
print(df_2)

# printing the dimensions(shape) of input matrix 1
print("The dimensions(shape) of input matrix 2:")
print(df_2.shape)
print()

# multiplying both the matrices inputMatrix_1 and inputMatrix_2
result_mult = df_1.dot(df_2)

# Printing the resultant of matrix multiplication of inputMatrix_1 and inputMatrix_2
print("Resultant Matrix after Matrix multiplication:")
print(result_mult)

# printing the dimensions(shape) of resultant Matrix
print("The dimensions(shape) of Resultant Matrix:")
print(result_mult.shape)

Sortie

inputMatrix_1:
0 1 2
0 1 2 2
1 1 2 0
2 1 0 2
The dimensions(shape) of input matrix 1:
(3, 3)

inputMatrix_2:
0 1 2
0 1 0 1
1 2 1 1
2 2 1 2
The dimensions(shape) of input matrix 2:
(3, 3)

Resultant Matrix after Matrix multiplication:
0 1 2
0 9 4 7
1 5 2 3
2 5 2 5
The dimensions(shape) of Resultant Matrix:
(3, 3)

Vous trouverez ci-dessous le tableau des différences entre la matrice et le bloc de données.

Matrice et cadre de données

Matrice Cadre de données
Il s'agit d'un ensemble d'ensembles de données disposés dans une organisation rectangulaire bidimensionnelle Il stocke des tableaux de données avec plusieurs types de données dans plusieurs colonnes appelées champs.
La matrice est un tableau m*n avec le même type de données Une trame de données est une liste de vecteurs de même longueur. Une trame de données est une forme généralisée de matrice.
Une matrice a un nombre fixe de lignes et de colonnes. Le nombre de lignes et de colonnes de Dataframe est variable.
Homogène Hétérogène

Conclusion

Nous avons découvert la différence entre la matrice et le bloc de données en Python dans cette application. Nous avons également appris à créer un bloc de données et à convertir une matrice en bloc de données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer