Pandas를 사용하여 CSV 파일을 읽고 데이터 처리하는 방법
pandas는 다양한 형식의 데이터를 읽고, 조작하고, 분석하는 기능을 제공하는 강력한 데이터 처리 및 분석 도구입니다. 이번 글에서는 팬더를 사용하여 CSV 파일을 읽고 데이터 처리를 수행하는 방법을 소개합니다.
먼저, pandas 라이브러리가 설치되어 있는지 확인하세요. 아직 설치되지 않은 경우 터미널에서 다음 명령을 실행하여 설치할 수 있습니다.
pip install pandas
다음으로 다음 샘플 CSV 파일을 사용하여 시연합니다.
name,age,city John,30,New York Alice,25,Los Angeles Bob,35,Chicago
이제 파일을 읽고 코드를 읽는 코드 작성을 시작해 보겠습니다. 데이터를 처리합니다.
먼저 pandas 라이브러리를 가져옵니다.
import pandas as pd
그런 다음 read_csv()
함수를 사용하여 CSV 파일을 읽습니다. read_csv()
函数读取CSV文件:
df = pd.read_csv('data.csv')
这将创建一个名为df
的pandas DataFrame对象来存储CSV文件的内容。
如果你想查看读取的数据,可以使用head()
函数来显示前几行数据:
print(df.head())
接下来,让我们介绍一些常用的数据处理操作。
name_column = df['name'] age_column = df['age']
loc
或iloc
函数:row_0 = df.loc[0] # 使用索引选择第一行数据 row_1 = df.iloc[1] # 使用位置选择第二行数据
filtered_data = df[df['age'] > 30] # 筛选年龄大于30的数据
insert()
函数添加新的列:df.insert(3, 'country', ['USA', 'USA', 'USA']) # 添加一个名为'country'的列,所有行的值都是'USA'
drop()
函数:df = df.drop('city', axis=1) # 删除名为'city'的列
df.loc[0, 'age'] = 31 # 修改第一行'age'列的值为31 df['age'] = df['age'] + 1 # 将'age'列的所有值加1
这些只是pandas提供的许多数据处理操作中的一部分。根据你的具体需求,还可以执行其他操作,如排序数据、合并数据和计算统计信息等。
最后,将数据保存到新的CSV文件中,可以使用to_csv()
df.to_csv('new_data.csv', index=False) # 将数据保存到名为'new_data.csv'的文件中,不包含行索引이렇게 하면
df
라는 pandas DataFrame이 생성됩니다. CSV 파일의 내용을 저장하는 개체입니다. 읽은 데이터를 보려면 head()
함수를 사용하여 데이터의 처음 몇 행을 표시할 수 있습니다. rrreee
다음으로 몇 가지 일반적인 데이터 처리 작업을 소개하겠습니다. 🎜loc
또는 iloc
함수를 사용할 수 있습니다. insert()
새 열을 추가하는 함수:drop()
함수: to_csv()
함수를 사용할 수 있습니다. 🎜rrreee🎜이것은 Pandas를 사용하여 CSV 파일을 읽고 데이터 처리를 수행합니다. 이러한 작업을 통해 다양한 형식의 데이터를 쉽게 처리하고 분석할 수 있습니다. 🎜🎜이 기사가 도움이 되기를 바라며, 데이터 처리 및 분석 여정에서 성공을 기원합니다! 🎜위 내용은 Python의 pandas 라이브러리를 사용하여 CSV 데이터를 읽고 조작하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!