>  기사  >  백엔드 개발  >  Pandas 사용 튜토리얼: JSON 파일 읽기를 위한 빠른 시작

Pandas 사용 튜토리얼: JSON 파일 읽기를 위한 빠른 시작

WBOY
WBOY원래의
2024-01-13 10:15:061288검색

Pandas 사용 튜토리얼: JSON 파일 읽기를 위한 빠른 시작

빠른 시작: JSON 파일을 읽는 Pandas 방법에는 특정 코드 예제가 필요합니다.

소개:
데이터 분석 및 데이터 과학 분야에서 Pandas는 중요한 Python 라이브러리 중 하나입니다. 풍부한 기능과 유연한 데이터 구조를 제공하며, 다양한 데이터를 쉽게 처리하고 분석할 수 있습니다. 실제 애플리케이션에서는 JSON 파일을 읽어야 하는 상황에 자주 직면합니다. 이 기사에서는 Pandas를 사용하여 JSON 파일을 읽고 특정 코드 예제를 첨부하는 방법을 소개합니다.

1. Pandas 설치 및 가져오기
Pandas 라이브러리를 사용하려면 먼저 설치해야 합니다. pip 도구를 사용하여 Pandas를 설치할 수 있습니다.

pip install pandas

설치가 완료되면 Python 스크립트에서 Pandas 라이브러리를 가져올 수 있습니다.

import pandas as pd

2. Pandas 사용 JSON 파일 읽기
Pandas를 사용하여 JSON 읽기 파일은 매우 간단합니다. pd.read_json() 함수를 호출하고 JSON 파일의 경로를 전달하기만 하면 됩니다. 예는 다음과 같습니다. pd.read_json()函数,传入JSON文件的路径即可。下面是一个示例:

import pandas as pd

# 读取JSON文件
df = pd.read_json('data.json')

这里假设我们有一个名为"data.json"的JSON文件,它包含了我们要处理的数据。

三、处理读取的数据
当Pandas成功读取JSON文件后,数据会被存储在一个数据帧(DataFrame)中。接下来,我们可以对这个数据帧进行各种操作和分析。

  1. 查看数据
    我们可以使用head()函数来查看数据的前几行,默认显示前5行。示例代码如下:

    # 查看前5行数据
    print(df.head())

    如果要显示更多行,可以在head()函数中传入一个整数参数,例如head(10)表示显示前10行数据。

  2. 获取列名
    使用columns

    # 获取列名
    print(df.columns)

    여기에는 처리하려는 데이터가 포함된 "data.json"이라는 JSON 파일이 있다고 가정합니다.
  3. 3. 읽은 데이터를 처리합니다

    Pandas가 JSON 파일을 성공적으로 읽으면 데이터가 데이터 프레임(DataFrame)에 저장됩니다. 다음으로 이 데이터 프레임에 대해 다양한 작업과 분석을 수행할 수 있습니다.

      데이터 보기

      head() 함수를 사용하면 데이터의 처음 몇 행을 볼 수 있습니다. 기본적으로 처음 5개 행이 표시됩니다. 샘플 코드는 다음과 같습니다.
  4. # 选择特定的列
    selected_columns = df[['column1', 'column2']]
    print(selected_columns)
  5. 더 많은 행을 표시하려면 head() 함수에 정수 매개변수를 전달할 수 있습니다(예: head(10)). code>는 처음 10행 데이터를 표시한다는 의미입니다. <p><br></p> <p>열 이름 가져오기</p> <code>columns 속성을 ​​사용하여 데이터 프레임의 열 이름 목록을 가져옵니다. 샘플 코드는 다음과 같습니다.
  6. # 筛选满足条件的记录
    filtered_data = df[df['column1'] > 10]
    print(filtered_data)


데이터 선택

데이터 프레임의 열 이름을 사용하여 데이터를 선택할 수 있습니다. 샘플 코드는 다음과 같습니다.

import pandas as pd

# 读取JSON文件
df = pd.read_json('data.json')

# 查看前5行数据
print(df.head())

# 获取列名
print(df.columns)

# 选择特定的列
selected_columns = df[['column1', 'column2']]
print(selected_columns)

# 筛选满足条件的记录
filtered_data = df[df['column1'] > 10]
print(filtered_data)

여기에서는 "column1"과 "column2"라는 두 개의 데이터 열을 선택하고 결과를 새 데이터 프레임에 저장합니다.


🎜데이터 필터링🎜조건식이나 부울 인덱스를 사용하여 데이터 프레임의 레코드를 필터링할 수 있습니다. 샘플 코드는 다음과 같습니다. 🎜rrreee🎜여기에서는 "column1" 열에서 10보다 큰 레코드를 선택하고 결과를 새 데이터 프레임에 저장합니다. 🎜🎜🎜🎜4. 전체 예🎜다음은 Pandas를 사용하여 JSON 파일을 읽고 데이터를 처리 및 분석하는 방법을 보여주는 전체 예입니다. 🎜rrreee🎜예제의 "data.json"에 유의하세요. 파일과 "column1", "column2" 등은 모두 가상 샘플 데이터이므로 실제 적용 시 구체적인 상황에 따라 수정해야 합니다. 🎜🎜결론: 🎜Pandas를 사용하여 JSON 파일을 읽는 것은 매우 간단한 작업이며 완료하는 데 몇 줄의 코드만 필요합니다. 읽은 데이터에 대한 선택, 필터링 및 기타 작업을 통해 데이터 분석 및 처리를 쉽게 수행할 수 있습니다. 이 기사의 소개와 예제가 독자가 Pandas 라이브러리를 더 잘 사용하는 데 도움이 되기를 바랍니다. 🎜

위 내용은 Pandas 사용 튜토리얼: JSON 파일 읽기를 위한 빠른 시작의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.