Maison >développement back-end >Tutoriel Python >Tutoriel d'utilisation de Pandas : Démarrage rapide pour la lecture de fichiers JSON
Démarrage rapide : la méthode Pandas de lecture des fichiers JSON nécessite des exemples de code spécifiques
Introduction :
Dans le domaine de l'analyse des données et de la science des données, Pandas est l'une des bibliothèques Python importantes. Il fournit des fonctions riches et des structures de données flexibles, et peut facilement traiter et analyser diverses données. Dans les applications pratiques, nous rencontrons souvent des situations où nous devons lire des fichiers JSON. Cet article expliquera comment utiliser Pandas pour lire des fichiers JSON et joindra des exemples de code spécifiques.
1. Installation et importation de Pandas
Pour utiliser la bibliothèque Pandas, vous devez d'abord l'installer. Vous pouvez utiliser l'outil pip pour installer Pandas. La commande est la suivante :
pip install pandas
Une fois l'installation terminée, vous pouvez importer la bibliothèque Pandas dans le script Python. L'exemple de code est le suivant :
import pandas as pd
2. Utilisez Pandas. pour lire les fichiers JSON
Utiliser Pandas pour lire JSON Le fichier est très simple Il suffit d'appeler la fonction pd.read_json()
et de transmettre le chemin du fichier JSON. Voici un exemple : pd.read_json()
函数,传入JSON文件的路径即可。下面是一个示例:
import pandas as pd # 读取JSON文件 df = pd.read_json('data.json')
这里假设我们有一个名为"data.json"的JSON文件,它包含了我们要处理的数据。
三、处理读取的数据
当Pandas成功读取JSON文件后,数据会被存储在一个数据帧(DataFrame)中。接下来,我们可以对这个数据帧进行各种操作和分析。
查看数据
我们可以使用head()
函数来查看数据的前几行,默认显示前5行。示例代码如下:
# 查看前5行数据 print(df.head())
如果要显示更多行,可以在head()
函数中传入一个整数参数,例如head(10)
表示显示前10行数据。
获取列名
使用columns
# 获取列名 print(df.columns)Ici, nous supposons que nous avons un fichier JSON appelé "data.json" qui contient les données que nous voulons traiter.
Lorsque Pandas lit avec succès le fichier JSON, les données seront stockées dans une trame de données (DataFrame). Ensuite, nous pouvons effectuer diverses opérations et analyses sur cette trame de données.
Afficher les données
Nous pouvons utiliser la fonctionhead()
pour afficher les premières lignes de données. Les 5 premières lignes sont affichées par défaut. L'exemple de code est le suivant : # 选择特定的列 selected_columns = df[['column1', 'column2']] print(selected_columns)
head()
, par exemple, head(10) code> signifie afficher les 10 premières données de ligne. <p><br></p>
<p>Obtenir les noms de colonnes</p>Utilisez l'attribut <code>columns
pour obtenir la liste des noms de colonnes du bloc de données. L'exemple de code est le suivant :
# 筛选满足条件的记录 filtered_data = df[df['column1'] > 10] print(filtered_data)
Sélectionner les données
import pandas as pd # 读取JSON文件 df = pd.read_json('data.json') # 查看前5行数据 print(df.head()) # 获取列名 print(df.columns) # 选择特定的列 selected_columns = df[['column1', 'column2']] print(selected_columns) # 筛选满足条件的记录 filtered_data = df[df['column1'] > 10] print(filtered_data)Ici, nous sélectionnerons deux colonnes de données nommées "colonne1" et "colonne2" et stockerons les résultats dans un nouveau bloc de données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!