Maison >développement back-end >Tutoriel Python >Obtenir le type de données de la colonne dans Pandas - Python

Obtenir le type de données de la colonne dans Pandas - Python

PHPz
PHPzavant
2023-08-30 20:01:021415parcourir

获取Pandas中列的数据类型 - Python

Pandas est une bibliothèque Python populaire et puissante couramment utilisée pour l'analyse et la manipulation de données. Il fournit un certain nombre de structures de données, notamment Series, DataFrame et Panel, pour travailler avec des données tabulaires et des séries chronologiques.

Pandas DataFrame est une structure de données tabulaire bidimensionnelle. Dans cet article, nous aborderons différentes manières de déterminer le type de données d'une colonne dans Pandas. Il existe de nombreuses situations dans lesquelles nous devons trouver le type de données d'une colonne dans un Pandas DataFrame. Chaque colonne d'un Pandas DataFrame peut contenir différents types de données.

Avant de continuer, créons un exemple de dataframe sur lequel nous devons obtenir le type de données de la colonne dans Pandas

import pandas as pd

# create a sample dataframe
df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]})

print(df)

Sortie

Ce script python imprime le DataFrame que nous avons créé.

  Vehicle name    price
0        Supra  5000000
1        Honda   600000
2   Lamorghini  7000000

Les méthodes que vous pouvez utiliser pour accomplir la tâche sont les suivantes

Méthode

  • Utilisez l'attribut dtypes

  • Utilisez select_dtypes()

  • Utilisez la méthode info()

  • Utilisez la fonction décrire()

Parlons maintenant de chaque méthode et de la manière de les utiliser pour obtenir le type de données d'une colonne dans Pandas.

Méthode 1 : Utilisation des attributs dtypes

Nous pouvons utiliser l'attribut dtypes pour obtenir le type de données de chaque colonne du DataFrame. Cette propriété renverra une série contenant le type de données de chaque colonne. La syntaxe suivante peut être utilisée :

Grammaire

df.dtypes

Type de retour Le type de données de chaque colonne du DataFrame.

Algorithme

  • Importez la bibliothèque Pandas.

  • Créez un DataFrame en utilisant la fonction pd.DataFrame() et transmettez les exemples sous forme de dictionnaire.

  • Utilisez la propriété dtypes pour obtenir le type de données de chaque colonne du DataFrame.

  • Imprimez les résultats pour vérifier le type de données de chaque colonne.

Exemple 1

# import the Pandas library
import pandas as pd

# create a sample dataframe
df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]})

# print the dataframe
print("DataFrame:\n", df)

# get the data types of each column
print("\nData types of each column:")
print(df.dtypes)

Sortie

DataFrame:
   Vehicle name    price
0        Supra  5000000
1        Honda   600000
2   Lamorghini  7000000

Data types of each column:
Vehicle name    object
price            int64
dtype: object

Exemple 2

Dans cet exemple, nous obtenons le type de données d'une seule colonne du DataFrame

# import the Pandas library
import pandas as pd

# create a sample dataframe
df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]})

# print the dataframe
print("DataFrame:\n", df)

# get the data types of column named price
print("\nData types of column named price:")
print(df.dtypes['price'])

Sortie

DataFrame:
   Vehicle name    price
0        Supra  5000000
1        Honda   600000
2   Lamorghini  7000000

Data types of column named price:
int64

Méthode 2 : utilisez select_dtypes()

Nous pouvons utiliser la méthode select_dtypes() pour filtrer les colonnes de types de données dont nous avons besoin. La méthode select_dtypes() renvoie un sous-ensemble de colonnes basé sur les types de données fournis en entrée. Cette méthode nous permet de sélectionner des colonnes appartenant à un type de données spécifique, puis de déterminer le type de données.

Algorithme

  • Importez la bibliothèque Pandas.

  • Utilisez la fonction pd.DataFrame() pour créer un DataFrame et transmettre les données données sous forme de dictionnaire.

  • Imprimez le DataFrame pour vérifier les données créées.

  • Utilisez la méthode select_dtypes() pour sélectionner toutes les colonnes numériques de DataFrame. Utilisez le paramètre include pour transmettre la liste des types de données que nous souhaitons sélectionner en tant que paramètres.

  • Faites une boucle sur les colonnes pour parcourir chaque colonne numérique et imprimer son type de données.

Exemple

# import the Pandas library
import pandas as pd

# create a sample dataframe
df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]})

# print the dataframe
print("DataFrame:\n", df)

# select the numeric columns
numeric_cols = df.select_dtypes(include=['float64', 'int64']).columns

# get the data type of each numeric column
for col in numeric_cols:
    print("Data Type of column", col, "is", df[col].dtype)

Sortie

DataFrame:
   Vehicle name    price
0        Supra  5000000
1        Honda   600000
2   Lamorghini  7000000
Data Type of column price is int64

Méthode 3 : Utilisez la méthode info()

Nous pouvons également utiliser la méthode info() pour effectuer nos tâches. La méthode info() nous donne un résumé concis du DataFrame, y compris le type de données de chaque colonne. La syntaxe suivante peut être utilisée :

Grammaire

DataFrame.info(verbose=None, buf=None, max_cols=None, memory_usage=None, null_counts=None)

Valeur de retourAucun

Algorithme

  • Importez la bibliothèque Pandas.

  • Créez un DataFrame à l'aide de la fonction pd.DataFrame() et transmettez les données ci-dessus sous forme de dictionnaire.

  • Imprimez le DataFrame pour vérifier les données créées.

  • Utilisez la méthode info() pour obtenir des informations sur le DataFrame.

  • Imprimez les informations obtenues à partir de la méthode info().

Exemple

# import the Pandas library
import pandas as pd

# create a sample dataframe
df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]})

# print the dataframe
print("DataFrame:\n", df)

# use the info() method to get the data type of each column
print(df.info())

Sortie

DataFrame:
   Vehicle name    price
0        Supra  5000000
1        Honda   600000
2   Lamorghini  7000000
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
 #   Column        Non-Null Count  Dtype 
---  ------        --------------  ----- 
 0   Vehicle name  3 non-null      object
 1   price         3 non-null      int64 
dtypes: int64(1), object(1)
memory usage: 176.0+ bytes
None

Méthode 4 : Utiliser la fonction décrire()

La méthode

describe() est utilisée pour générer des statistiques descriptives du DataFrame, y compris le type de données de chaque colonne.

Algorithme

  • Utilisez l'instruction import pour importer la bibliothèque Pandas.

  • Utilisez la fonction pd.DataFrame() pour créer un DataFrame et transmettre les données données sous forme de dictionnaire.

  • Imprimez le DataFrame pour vérifier les données créées.

  • Utilisez la méthode décrire() pour obtenir les statistiques descriptives du DataFrame.

  • Utilisez le paramètre include de la méthodescribe() pour 'all' pour inclure toutes les colonnes dans les statistiques descriptives.

  • Utilisez la propriété dtypes pour obtenir le type de données de chaque colonne du DataFrame.

  • Imprimez le type de données de chaque colonne.

Exemple

# import the Pandas library
import pandas as pd

# create a sample dataframe
df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]})

# print the dataframe
print("DataFrame:\n", df)

# use the describe() method to get the descriptive statistics of the dataframe
desc_stats = df.describe(include='all')

# get the data type of each column 
dtypes = desc_stats.dtypes

# print the data type of each column
print("Data type of each column in the descriptive statistics:\n", dtypes)

Sortie

DataFrame:
   Vehicle name    price
0        Supra  5000000
1        Honda   600000
2   Lamorghini  7000000
Data type of each column in the descriptive statistics:
 Vehicle name     object
price           float64
dtype: object

Conclusion

En sachant comment obtenir le type de données de chaque colonne, nous pouvons effectuer efficacement diverses opérations de données et travaux d'analyse. Chaque méthode présente ses propres avantages et inconvénients selon la méthode ou la fonction utilisée. Vous pouvez choisir la méthode souhaitée en fonction de la complexité souhaitée de l’expression et de vos préférences personnelles de codage.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer