Maison > Article > développement back-end > Quelle est la différence entre les trames de données et les matrices dans Python Pandas ?
Dans cet article, nous allons vous montrer la différence entre dataframe et matrice en python panda.
Les trames de données et les matrices sont toutes deux des structures de données bidimensionnelles. De manière générale, une trame de données peut contenir plusieurs types de données (nombres, caractères, facteurs, etc.), tandis qu'une matrice ne peut stocker qu' un type de données.
En Python, DataFrame est une structure de données bidimensionnelle, tabulaire et mutable qui peut stocker des données tabulaires contenant des objets de différents types de données. DataFrame a des axes étiquetés en lignes et en colonnes. Les DataFrames sont des outils utiles dans le prétraitement des données car ils fournissent des méthodes de traitement de données précieuses. DataFrame peut également être utilisé pour créer des tableaux croisés dynamiques et tracer des données à l'aide de Matplotlib.
Les trames de données peuvent effectuer diverses tâches telles que l'ajustement de formules statistiques.
Traitement des données (La matrice n'est pas possible, doit d'abord être convertie en trame de données)
Convertissez les lignes en colonnes et vice versa, très utile en science des données.
Voici les algorithmes/étapes à suivre pour effectuer la tâche requise -
Utilisez le mot-clé import pour importer les modules pandas, numpy avec des alias.
Utilisez la fonction DataFrame() du module pandas pour créer un bloc de données.
Imprimez le bloc de données d'entrée.
Le programme suivant utilise la fonction DataFrame() pour renvoyer une trame de données -
# importing pandas, numpy modules with alias names import pandas as pd import numpy as np # creating a dataframe inputDataframe = pd.DataFrame({'Name': ['Virat', 'Rohit', 'Meera', 'Nick', 'Sana'], 'Jobrole': ['Developer', 'Analyst', 'Help Desk', 'Database Developer', 'Finance accountant'], 'Age': [25, 30, 28, 25, 40]}) # displaying the dataframe print(inputDataframe)
Une fois exécuté, le programme ci-dessus générera le résultat suivant -
Name Jobrole Age 0 Virat Developer 25 1 Rohit Analyst 30 2 Meera Help Desk 28 3 Nick Database Developer 25 4 Sana Finance accountant 40
Une matrice est une collection d'ensembles de données homogènes organisés dans une grille rectangulaire bidimensionnelle. Il s'agit d'un tableau m*n avec le même type de données. Il est créé avec une entrée vectorielle. Il existe un nombre fixe de lignes et de colonnes. Python prend en charge diverses opérations arithmétiques telles que l'addition, la soustraction, la multiplication et la division sur Matrix.
Il est très utile en économie pour calculer des statistiques telles que le PIB (produit intérieur brut) ou le PI (prix par habitant).
Il est également utile pour étudier les circuits électriques et électroniques.
Imprimez le bloc de données d'entrée.
Matrix est utilisé pour la recherche, comme dessiner des graphiques.
Ceci est utile en probabilités et en statistiques.
Voici les algorithmes/étapes à suivre pour effectuer la tâche requise -
Utilisez le mot-clé import pour importer le module pandas avec un alias.
Créez deux variables pour stocker respectivement les deux matrices d'entrée.
Créez des dataframes pour les première et deuxième matrices à l'aide de la fonction DataFrame() (Create DataFrame) du module pandas et stockez-les dans des variables séparées. Ces données sont chargées dans les Pandas DataFrames.
Imprimez le bloc de données de la matrice d'entrée 1.
Imprimez les dimensions (forme) de la matrice d'entrée 1 en appliquant l'attribut shape.
Imprimez la trame de données de la matrice d'entrée 2.
Imprimez les dimensions (forme) de la matrice d'entrée 2 en appliquant l'attribut shape.
Utilisez la fonction dot() pour multiplier les matrices inputMatrix_1 et inputMatrix_2 et créez une variable pour la stocker.
Imprimez la matrice résultat de la multiplication des matrices inputMatrix_1 et inputMatrix_2.
Imprimez les dimensions (forme) de la matrice résultante en appliquant l'attribut shape.
Le programme suivant utilise la fonction DataFrame() pour renvoyer une trame de données -
# importing pandas module import pandas as pd # input matrix 1 inputMatrix_1 = [[1, 2, 2], [1, 2, 0], [1, 0, 2]] # input matrix 2 inputMatrix_2 = [[1, 0, 1], [2, 1, 1], [2, 1, 2]] # creating a dataframe of first matrix #(here data is loaded into a pandas DataFrames) df_1 = pd.DataFrame(data=inputMatrix_1) # creating a dataframe of second matrix df_2 = pd.DataFrame(data=inputMatrix_2) # printing the dataframe of input matrix 1 print("inputMatrix_1:") print(df_1) # printing the dimensions(shape) of input matrix 1 print("The dimensions(shape) of input matrix 1:") print(df_1.shape) print() # printing the dataframe of input matrix 2 print("inputMatrix_2:") print(df_2) # printing the dimensions(shape) of input matrix 1 print("The dimensions(shape) of input matrix 2:") print(df_2.shape) print() # multiplying both the matrices inputMatrix_1 and inputMatrix_2 result_mult = df_1.dot(df_2) # Printing the resultant of matrix multiplication of inputMatrix_1 and inputMatrix_2 print("Resultant Matrix after Matrix multiplication:") print(result_mult) # printing the dimensions(shape) of resultant Matrix print("The dimensions(shape) of Resultant Matrix:") print(result_mult.shape)
inputMatrix_1: 0 1 2 0 1 2 2 1 1 2 0 2 1 0 2 The dimensions(shape) of input matrix 1: (3, 3) inputMatrix_2: 0 1 2 0 1 0 1 1 2 1 1 2 2 1 2 The dimensions(shape) of input matrix 2: (3, 3) Resultant Matrix after Matrix multiplication: 0 1 2 0 9 4 7 1 5 2 3 2 5 2 5 The dimensions(shape) of Resultant Matrix: (3, 3)
Vous trouverez ci-dessous le tableau des différences entre la matrice et le bloc de données.
Matrice | Cadre de données |
---|---|
Il s'agit d'un ensemble d'ensembles de données disposés dans une organisation rectangulaire bidimensionnelle | Il stocke des tableaux de données avec plusieurs types de données dans plusieurs colonnes appelées champs. |
La matrice est un tableau m*n avec le même type de données | Une trame de données est une liste de vecteurs de même longueur. Une trame de données est une forme généralisée de matrice. |
Une matrice a un nombre fixe de lignes et de colonnes. | Le nombre de lignes et de colonnes de Dataframe est variable. |
Homogène | Hétérogène |
Nous avons découvert la différence entre la matrice et le bloc de données en Python dans cette application. Nous avons également appris à créer un bloc de données et à convertir une matrice en bloc de données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!