>  기사  >  백엔드 개발  >  Python의 pandas 라이브러리를 사용하여 CSV 데이터를 읽고 조작하는 방법

Python의 pandas 라이브러리를 사용하여 CSV 데이터를 읽고 조작하는 방법

WBOY
WBOY원래의
2024-01-13 08:20:071339검색

Python의 pandas 라이브러리를 사용하여 CSV 데이터를 읽고 조작하는 방법

Pandas를 사용하여 CSV 파일을 읽고 데이터 처리하는 방법

pandas는 다양한 형식의 데이터를 읽고, 조작하고, 분석하는 기능을 제공하는 강력한 데이터 처리 및 분석 도구입니다. 이번 글에서는 팬더를 사용하여 CSV 파일을 읽고 데이터 처리를 수행하는 방법을 소개합니다.

먼저, pandas 라이브러리가 설치되어 있는지 확인하세요. 아직 설치되지 않은 경우 터미널에서 다음 명령을 실행하여 설치할 수 있습니다.

pip install pandas

다음으로 다음 샘플 CSV 파일을 사용하여 시연합니다.

name,age,city
John,30,New York
Alice,25,Los Angeles
Bob,35,Chicago

이제 파일을 읽고 코드를 읽는 코드 작성을 시작해 보겠습니다. 데이터를 처리합니다.

먼저 pandas 라이브러리를 가져옵니다.

import pandas as pd

그런 다음 read_csv() 함수를 사용하여 CSV 파일을 읽습니다. read_csv()函数读取CSV文件:

df = pd.read_csv('data.csv')

这将创建一个名为df的pandas DataFrame对象来存储CSV文件的内容。

如果你想查看读取的数据,可以使用head()函数来显示前几行数据:

print(df.head())

接下来,让我们介绍一些常用的数据处理操作。

  1. 选择列:
    要选择特定的列,可以使用列名称作为索引:
name_column = df['name']
age_column = df['age']
  1. 选择行:
    要选择特定的行,可以使用lociloc函数:
row_0 = df.loc[0]  # 使用索引选择第一行数据
row_1 = df.iloc[1]  # 使用位置选择第二行数据
  1. 筛选数据:
    可以使用条件来筛选满足特定条件的数据:
filtered_data = df[df['age'] > 30]  # 筛选年龄大于30的数据
  1. 添加列:
    可以使用insert()函数添加新的列:
df.insert(3, 'country', ['USA', 'USA', 'USA'])  # 添加一个名为'country'的列,所有行的值都是'USA'
  1. 删除列:
    要删除列,使用drop()函数:
df = df.drop('city', axis=1)  # 删除名为'city'的列
  1. 修改数据:
    要修改数据,可以使用索引或条件进行选择并重新赋值:
df.loc[0, 'age'] = 31  # 修改第一行'age'列的值为31
df['age'] = df['age'] + 1  # 将'age'列的所有值加1

这些只是pandas提供的许多数据处理操作中的一部分。根据你的具体需求,还可以执行其他操作,如排序数据、合并数据和计算统计信息等。

最后,将数据保存到新的CSV文件中,可以使用to_csv()

df.to_csv('new_data.csv', index=False)  # 将数据保存到名为'new_data.csv'的文件中,不包含行索引

이렇게 하면 df라는 pandas DataFrame이 생성됩니다. CSV 파일의 내용을 저장하는 개체입니다.

읽은 데이터를 보려면 head() 함수를 사용하여 데이터의 처음 몇 행을 표시할 수 있습니다.

rrreee

다음으로 몇 가지 일반적인 데이터 처리 작업을 소개하겠습니다. 🎜
  1. 열 선택:
    특정 열을 선택하려면 열 이름을 인덱스로 사용할 수 있습니다:
rrreee
  1. 선택 행:특정 행을 선택하려면 loc 또는 iloc 함수를 사용할 수 있습니다.
rrreee
  1. 데이터 필터링:
    조건을 사용하여 특정 조건을 충족하는 데이터를 필터링할 수 있습니다.
rrreee
  1. 열 추가:
    다음을 사용할 수 있습니다. insert() 새 열을 추가하는 함수:
rrreee
  1. 열 삭제:
    열을 삭제하려면 다음을 사용하세요. drop()함수:
rrreee
  1. 데이터 수정:
    데이터를 수정하려면 색인이나 조건을 사용하여 선택할 수 있습니다. 재할당:
  2. ol>rrreee🎜이것들은 pandas가 제공하는 많은 데이터 처리 작업 중 일부일 뿐입니다. 특정 요구 사항에 따라 데이터 정렬, 데이터 병합, 통계 계산 등의 다른 작업을 수행할 수도 있습니다. 🎜🎜마지막으로 데이터를 새 CSV 파일에 저장하려면 to_csv() 함수를 사용할 수 있습니다. 🎜rrreee🎜이것은 Pandas를 사용하여 CSV 파일을 읽고 데이터 처리를 수행합니다. 이러한 작업을 통해 다양한 형식의 데이터를 쉽게 처리하고 분석할 수 있습니다. 🎜🎜이 기사가 도움이 되기를 바라며, 데이터 처리 및 분석 여정에서 성공을 기원합니다! 🎜

위 내용은 Python의 pandas 라이브러리를 사용하여 CSV 데이터를 읽고 조작하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.