Heim >Backend-Entwicklung >Python-Tutorial >Tutorial zur Pandas-Nutzung: Schnellstart zum Lesen von JSON-Dateien
Schnellstart: Die Pandas-Methode zum Lesen von JSON-Dateien erfordert spezifische Codebeispiele
Einführung:
Im Bereich Datenanalyse und Datenwissenschaft ist Pandas eine der wichtigsten Python-Bibliotheken. Es bietet umfangreiche Funktionen und flexible Datenstrukturen und kann verschiedene Daten problemlos verarbeiten und analysieren. In praktischen Anwendungen stoßen wir häufig auf Situationen, in denen wir JSON-Dateien lesen müssen. In diesem Artikel wird erläutert, wie Sie mit Pandas JSON-Dateien lesen und spezifische Codebeispiele anhängen.
1. Installation und Import von Pandas
Um die Pandas-Bibliothek nutzen zu können, müssen Sie sie zunächst installieren. Sie können das Pip-Tool verwenden, um Pandas zu installieren. Der Befehl lautet wie folgt:
pip install pandas
Nachdem die Installation abgeschlossen ist, können Sie die Pandas-Bibliothek wie folgt in das Python-Skript importieren:
import pandas as pd
2. Verwenden Sie Pandas um JSON-Dateien zu lesen
Verwenden Sie Pandas, um JSON zu lesen. Die Datei ist sehr einfach. Sie müssen nur die Funktion pd.read_json()
aufrufen und den Pfad der JSON-Datei übergeben. Hier ist ein Beispiel: pd.read_json()
函数,传入JSON文件的路径即可。下面是一个示例:
import pandas as pd # 读取JSON文件 df = pd.read_json('data.json')
这里假设我们有一个名为"data.json"的JSON文件,它包含了我们要处理的数据。
三、处理读取的数据
当Pandas成功读取JSON文件后,数据会被存储在一个数据帧(DataFrame)中。接下来,我们可以对这个数据帧进行各种操作和分析。
查看数据
我们可以使用head()
函数来查看数据的前几行,默认显示前5行。示例代码如下:
# 查看前5行数据 print(df.head())
如果要显示更多行,可以在head()
函数中传入一个整数参数,例如head(10)
表示显示前10行数据。
获取列名
使用columns
# 获取列名 print(df.columns)Hier gehen wir davon aus, dass wir eine JSON-Datei namens „data.json“ haben, die die Daten enthält, die wir verarbeiten möchten.
Wenn Pandas die JSON-Datei erfolgreich liest, werden die Daten in einem Datenrahmen (DataFrame) gespeichert. Als nächstes können wir verschiedene Operationen und Analysen an diesem Datenrahmen durchführen.
Daten anzeigen
Wir können die Funktionhead()
verwenden, um die ersten Datenzeilen anzuzeigen. Die ersten 5 Zeilen werden standardmäßig angezeigt. Der Beispielcode lautet wie folgt: # 选择特定的列 selected_columns = df[['column1', 'column2']] print(selected_columns)
head()
übergeben, zum Beispiel head(10) Code> bedeutet, dass die ersten 10 Zeilendaten angezeigt werden. <p><br></p>
<p>Spaltennamen abrufen</p>Verwenden Sie das Attribut <code>columns
, um die Spaltennamenliste des Datenrahmens abzurufen. Der Beispielcode lautet wie folgt:
# 筛选满足条件的记录 filtered_data = df[df['column1'] > 10] print(filtered_data)
Daten auswählen
import pandas as pd # 读取JSON文件 df = pd.read_json('data.json') # 查看前5行数据 print(df.head()) # 获取列名 print(df.columns) # 选择特定的列 selected_columns = df[['column1', 'column2']] print(selected_columns) # 筛选满足条件的记录 filtered_data = df[df['column1'] > 10] print(filtered_data)Hier werden zwei Datenspalten mit den Namen „Spalte1“ und „Spalte2“ ausgewählt und die Ergebnisse in einem neuen Datenrahmen gespeichert.
Das obige ist der detaillierte Inhalt vonTutorial zur Pandas-Nutzung: Schnellstart zum Lesen von JSON-Dateien. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!