>백엔드 개발 >파이썬 튜토리얼 >팬더로 csv 파일을 읽는 방법

팬더로 csv 파일을 읽는 방법

小老鼠
小老鼠원래의
2023-12-01 16:18:082874검색

CSV 파일을 읽는 방법에는 read_csv() 함수 사용, 구분 기호 지정, 열 이름 지정, 행 건너뛰기, 누락된 값 처리, 사용자 정의 데이터 유형 등이 포함됩니다. 자세한 소개: 1. read_csv() 함수는 Pandas에서 CSV 파일을 읽는 데 가장 일반적으로 사용되는 방법입니다. 로컬 파일 시스템이나 원격 URL에서 CSV 데이터를 로드하고 DataFrame 객체를 반환할 수 있습니다. 2. 구분 기호를 지정합니다. 기본적으로 read_csv() 함수는 CSV 파일 등에 대한 구분 기호로 쉼표를 사용합니다.

팬더로 csv 파일을 읽는 방법

이 튜토리얼의 운영 체제: Windows 10 시스템, Python 버전 3.11.4, Dell G3 컴퓨터.

Pandas는 데이터 과학 및 기계 학습 분야에서 널리 사용되는 강력한 데이터 처리 및 분석 도구입니다. 다양한 유형의 데이터 파일을 읽고 처리하기 위한 강력하면서도 사용하기 쉬운 방법을 제공합니다. 그 중 CSV 파일을 읽고 처리하는 것은 Pandas의 중요한 기능입니다.

일반적인 읽기 방법 및 기법

먼저 Pandas 라이브러리를 설치해야 합니다. Pandas는 pip 명령을 사용하여 터미널이나 명령 프롬프트에서 다음 명령을 실행하여 설치할 수 있습니다.

pip install pandas

설치가 완료된 후 Python 스크립트에서 Pandas 라이브러리를 가져오고 CSV 파일 읽기를 시작할 수 있습니다.

import pandas as pd

Pandas는 CSV 파일을 읽는 다양한 방법을 제공합니다. 다음은 일반적으로 사용되는 몇 가지 방법입니다.

1. read_csv() 함수를 사용하세요

read_csv() 함수는 Pandas에서 CSV 파일을 읽는 데 가장 일반적으로 사용되는 방법입니다. 로컬 파일 시스템이나 원격 URL에서 CSV 데이터를 로드하고 DataFrame 개체를 반환할 수 있습니다.

df = pd.read_csv('data.csv')

위 코드는 현재 작업 디렉터리에 있는 data.csv 파일에서 데이터를 읽고 이를 df라는 DataFrame 개체에 저장합니다. CSV 파일이 다른 디렉터리에 있는 경우 전체 파일 경로를 제공할 수 있습니다.

2. 구분 기호를 지정하세요

기본적으로 read_csv() 함수는 CSV 파일의 구분 기호로 쉼표를 사용합니다. CSV 파일이 다른 구분 기호를 사용하는 경우 sep 매개변수를 통해 지정할 수 있습니다.

df = pd.read_csv('data.csv', sep=';')

위 코드는 세미콜론을 구분 기호로 사용하여 CSV 파일을 읽습니다.

3. 열 이름 지정

CSV 파일에 열 이름이 없거나 열 이름이 요구 사항을 충족하지 않는 경우 names 매개변수를 통해 사용자 정의 열 이름을 지정할 수 있습니다.

df = pd.read_csv('data.csv', names=['column1', 'column2', 'column3'])

위 코드는 사용자 정의 열 이름을 사용하여 CSV 파일을 읽습니다.

4. 줄 건너뛰기

때때로 CSV 파일의 첫 번째 줄이나 처음 몇 줄은 관련 없는 정보이며 이러한 줄은 Skiprows 매개변수를 통해 건너뛸 수 있습니다.

df = pd.read_csv('data.csv', skiprows=3)

위 코드는 CSV 파일의 처음 세 줄을 건너뛰고 후속 데이터를 읽습니다.

5. 누락된 값 처리

CSV 파일에 누락된 값이 있을 수 있습니다. na_values ​​매개변수를 통해 누락된 값의 표현을 지정할 수 있습니다.

df = pd.read_csv('data.csv', na_values=['NA', 'NaN'])

위 코드는 모든 'NA' 및 'NaN'을 누락된 값으로 식별합니다.

6. 사용자 정의 데이터 유형

때때로 CSV 파일의 일부 열은 특정 데이터 유형으로 처리되어야 합니다. dtype 매개변수를 통해 각 열의 데이터 유형을 지정할 수 있습니다.

df = pd.read_csv('data.csv', dtype={'column1': int, 'column2': float})

위 코드는 컬럼1의 데이터 유형을 정수로 설정하고 컬럼2의 데이터 유형을 부동 소수점으로 설정합니다.

위는 Pandas로 CSV 파일을 읽는 데 일반적으로 사용되는 몇 가지 방법과 기술입니다. 이러한 방법을 유연하게 적용하면 다양한 유형의 CSV 파일을 쉽게 읽고 처리할 수 있으며, 추가 데이터 분석 및 처리를 수행할 수 있습니다.

위 내용은 팬더로 csv 파일을 읽는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.