Maison > Article > développement back-end > Utilisez des exemples pour présenter comment importer la bibliothèque pandas
Un guide pratique pour importer la bibliothèque pandas
Introduction :
Dans le domaine de l'analyse de données et du machine learning, la bibliothèque pandas est un outil très puissant. Il offre de riches fonctionnalités pour la lecture, le traitement et l’analyse des données. Cet article vous fournira un guide pratique pour importer la bibliothèque pandas et présentera quelques exemples de code spécifiques pour aider les lecteurs à mieux comprendre et utiliser la bibliothèque pandas.
1. Installez la bibliothèque pandas
Pour utiliser la bibliothèque pandas, vous devez d'abord l'installer. Il existe de nombreuses façons d'installer la bibliothèque pandas, la méthode la plus courante consiste à utiliser la commande pip. Entrez la commande suivante sur la ligne de commande pour installer la bibliothèque pandas :
pip install pandas
Une fois l'installation terminée, vous pouvez commencer à utiliser la bibliothèque pandas.
2. Importer la bibliothèque pandas
Avant d'utiliser la bibliothèque pandas, vous devez d'abord l'importer dans l'environnement Python. L'approche habituelle consiste à importer la bibliothèque pandas à l'aide de l'instruction import, comme indiqué ci-dessous :
import pandas as pd
Dans cet exemple, nous importons la bibliothèque pandas et la référençons avec l'alias "pd". C'est une pratique courante car « pd » est plus concis que « pandas » et plus facile à utiliser dans le code.
3. Lecture de données
L'une des fonctions les plus couramment utilisées de la bibliothèque pandas est de lire divers fichiers de données. Nous pouvons utiliser la fonction read_xxx() fournie par la bibliothèque pandas pour lire différents types de fichiers, tels que des fichiers CSV, des fichiers Excel, des bases de données SQL, etc.
Lecture de fichiers CSV
L'exemple suivant montre comment lire un fichier CSV et stocker les données dans un objet DataFrame.
data = pd.read_csv("data.csv")
Dans cet exemple, nous lisons un fichier CSV nommé "data.csv" dans un objet DataFrame nommé "data".
Lire les fichiers Excel
Si vous souhaitez lire des fichiers Excel, vous pouvez utiliser la fonction read_excel() de la bibliothèque pandas. L'exemple suivant montre comment lire un fichier Excel.
data = pd.read_excel("data.xlsx")
Dans cet exemple, nous lisons un fichier Excel nommé "data.xlsx" dans un objet DataFrame nommé "data".
Lire la base de données SQL
Si vous souhaitez lire des données dans une base de données SQL, vous pouvez utiliser la fonction read_sql() de la bibliothèque pandas. L'exemple suivant montre comment se connecter à une base de données SQLite nommée "mydb" et y lire une table nommée "customers".
import sqlite3 con = sqlite3.connect("mydb.db") data = pd.read_sql("SELECT * FROM customers", con)
Dans cet exemple, nous utilisons d'abord la bibliothèque sqlite3 pour nous connecter à la base de données SQLite et assignons l'objet de connexion à la variable "con". Ensuite, nous avons exécuté une requête SELECT en utilisant la fonction read_sql() de la bibliothèque pandas et stocké les résultats de la requête dans un objet DataFrame "data".
4. Traitement et analyse des données
La bibliothèque pandas offre une multitude de fonctions pour effectuer diverses opérations de traitement sur les données, telles que le filtrage, le tri, le regroupement, le calcul, etc.
Filtrage des données
Pour filtrer les données dans le DataFrame, vous pouvez utiliser des instructions conditionnelles. L'exemple suivant montre comment filtrer les données des personnes de plus de 30 ans.
selected_data = data[data['age'] > 30]
Dans cet exemple, nous utilisons l'instruction conditionnelle "data['age'] > 30" pour filtrer les données dans l'objet DataFrame "data" et stocker les données qui remplissent les conditions dans un nouvel objet DataFrame "selected_data " "milieu.
Tri des données
Pour trier les données dans le DataFrame, vous pouvez utiliser la fonction sort_values(). L'exemple suivant montre comment trier les données du plus petit au plus grand âge.
sorted_data = data.sort_values('age')
Dans cet exemple, nous utilisons la fonction sort_values() pour trier les données dans l'objet DataFrame "data" en fonction du nom de colonne "age", et stockons les résultats du tri dans un nouvel objet DataFrame "sorted_data".
Regroupement de données
Pour regrouper les données dans le DataFrame, vous pouvez utiliser la fonction groupby(). L'exemple suivant montre comment regrouper les données par sexe et effectuer des calculs statistiques.
grouped_data = data.groupby('gender').mean()
Dans cet exemple, nous utilisons la fonction groupby() pour regrouper les données dans l'objet DataFrame "data" par le nom de colonne "gender" et utilisons la fonction Mean() pour calculer la moyenne de chaque regroupement.
Calcul de données
La bibliothèque pandas prend en charge une variété d'opérations de calcul, telles que l'addition, la soustraction, la multiplication, la division, etc. L'exemple suivant montre comment calculer une nouvelle colonne "total_sales" dont la valeur est égale au produit de la colonne "quantité" et de la colonne "prix".
data['total_sales'] = data['quantity'] * data['price']
Dans cet exemple, nous utilisons l'opérateur ordinaire "*" pour multiplier les éléments de la colonne "quantité" et de la colonne "prix" un par un, et affecter le résultat de l'opération à une nouvelle colonne "total_sales".
Conclusion :
Cet article fournit un guide pratique pour importer la bibliothèque pandas et présente quelques exemples de code spécifiques. En lisant cet article et en pratiquant l'exemple de code, les lecteurs peuvent mieux comprendre et utiliser la bibliothèque pandas pour effectuer plus efficacement des tâches d'analyse de données et d'apprentissage automatique. J'espère que cet article sera utile aux lecteurs !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!