ホームページ  >  記事  >  バックエンド開発  >  Pandas の使用法チュートリアル: JSON ファイルを読み取るためのクイック スタート

Pandas の使用法チュートリアル: JSON ファイルを読み取るためのクイック スタート

WBOY
WBOYオリジナル
2024-01-13 10:15:061207ブラウズ

Pandas の使用法チュートリアル: JSON ファイルを読み取るためのクイック スタート

クイック スタート: JSON ファイルを読み取る Pandas メソッドには特定のコード サンプルが必要です

はじめに:
データ分析とデータ サイエンスの分野では、Pandas は重要なツールです。 Python ライブラリの 1 つ。豊富な機能と柔軟なデータ構造を備え、さまざまなデータを簡単に処理・分析できます。実際のアプリケーションでは、JSON ファイルを読み取る必要がある状況によく遭遇します。この記事では、Pandas を使用して JSON ファイルを読み取る方法を紹介し、具体的なコード例を添付します。

1. Pandas のインストールとインポート
Pandas ライブラリを使用するには、まずインストールする必要があります。 pip ツールを使用して Pandas をインストールできます。コマンドは次のとおりです:

pip install pandas

インストールが完了したら、Python スクリプトに Pandas ライブラリをインポートできます。サンプル コードは次のとおりです:

import pandas as pd

2. Pandas を使用して JSON ファイルを読み取る
Pandas を使用して JSON ファイルを読み取るのは非常に簡単で、pd.read_json() 関数を呼び出して JSON のパスを渡すだけです。ファイル。以下に例を示します。

import pandas as pd

# 读取JSON文件
df = pd.read_json('data.json')

ここでは、処理するデータが含まれる「data.json」という名前の JSON ファイルがあると仮定します。

3. 読み取ったデータを処理する
Pandas が JSON ファイルの読み取りに成功すると、データはデータ フレーム (DataFrame) に保存されます。次に、このデータ フレームに対してさまざまな操作や分析を実行できます。

  1. データの表示
    head() 関数を使用して、データの最初の数行を表示できます。デフォルトでは、最初の 5 行が表示されます。サンプル コードは次のとおりです。

    # 查看前5行数据
    print(df.head())

    より多くの行を表示したい場合は、head() 関数に整数パラメータを渡すことができます (例: head(10) ) は、データの最初の 10 行を表示することを意味します。

  2. 列名の取得
    columns 属性を使用して、データ フレームの列名のリストを取得します。サンプル コードは次のとおりです。

    # 获取列名
    print(df.columns)
  3. データの選択
    データ フレームの列名を使用してデータを選択できます。サンプル コードは次のとおりです。

    # 选择特定的列
    selected_columns = df[['column1', 'column2']]
    print(selected_columns)

    ここでは、「column1」と「column2」という名前の 2 つのデータ列が選択され、結果が新しいデータ フレームに保存されます。

  4. データのフィルタリング
    条件式またはブール インデックスを使用して、データ フレーム内のレコードをフィルタリングできます。サンプル コードは次のとおりです。

    # 筛选满足条件的记录
    filtered_data = df[df['column1'] > 10]
    print(filtered_data)

    ここでは、「column1」列で 10 を超えるレコードを選択し、結果を新しいデータ フレームに保存します。

4. 完全な例
次は、Pandas を使用して JSON ファイルを読み取り、データを処理および分析する方法を示す完全な例です:

import pandas as pd

# 读取JSON文件
df = pd.read_json('data.json')

# 查看前5行数据
print(df.head())

# 获取列名
print(df.columns)

# 选择特定的列
selected_columns = df[['column1', 'column2']]
print(selected_columns)

# 筛选满足条件的记录
filtered_data = df[df['column1'] > 10]
print(filtered_data)

なお、例の「data.json」ファイルや「column1」、「column2」などは仮想的なサンプルデータであり、実際の適用時には状況に応じて変更する必要があります。

結論:
Pandas を使用した JSON ファイルの読み取りは、数行のコードを実行するだけで完了する非常に単純なタスクです。読み込んだデータに対して選択やフィルタリングなどを行うことで、データの分析や加工が容易に行えます。この記事の紹介と例が、読者が Pandas ライブラリをより効果的に使用するのに役立つことを願っています。

以上がPandas の使用法チュートリアル: JSON ファイルを読み取るためのクイック スタートの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。