>백엔드 개발 >파이썬 튜토리얼 >Pandas로 CSV 파일을 가져올 때 특정 행을 건너뛰는 방법은 무엇입니까?

Pandas로 CSV 파일을 가져올 때 특정 행을 건너뛰는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-11-02 13:57:03212검색

How to Skip Specific Rows When Importing CSV Files with Pandas?

CSV 가져오기를 위한 Pandas의 행 건너뛰기 인수 해석

pandas.read_csv()를 사용하여 CSV 파일을 DataFrame으로 가져올 때 다음을 수행할 수 있습니다. 가져오기 프로세스에서 특정 행을 제외하려는 상황이 발생합니다. Skiprows 인수는 이 기능을 제공하지만 구문이 모호할 수 있습니다.

모호함 이해

pandas 문서에는 Skiprow가 행 번호 목록( 0-인덱스) 또는 파일 시작 부분에서 건너뛸 행 수를 나타내는 정수입니다. 이러한 모호함은 인덱스 1이 있는 행과 같이 특정 행을 건너뛰려고 할 때 혼란을 초래할 수 있습니다.

동작 결정

skiprow의 동작을 명확히 하려면 , 다음 시나리오를 고려하십시오.

  • skiprows=1: 이 인수는 인덱스 1이 있는 행이 아닌 CSV 파일의 첫 번째 행을 건너뜁니다.
  • skiprows=[1] : 이 인수는 특히 인덱스 1이 있는 행을 건너뜁니다.

예시 데모

동작을 살펴보겠습니다. StringIO 객체 사용:

<code class="python">import pandas as pd
from io import StringIO

s = "1, 2\n3, 4\n5, 6"

# Skipping the first row
df1 = pd.read_csv(StringIO(s), skiprows=[1], header=None)

# Skipping the row with index 1
df2 = pd.read_csv(StringIO(s), skiprows=1, header=None)

print(df1)
print(df2)</code>

출력:

   0  1
0  1  2
1  5  6

   0  1
0  3  4
1  5  6

보시다시피, Skiprows=[1]은 두 번째 행(인덱스 1)을 건너뛰고, Skiprows=1은 첫 번째 행.

결론

pandas.read_csv()를 사용하여 CSV를 가져오는 동안 특정 행을 건너뛰려면 Skiprows=[row_index] 구문을 사용하세요. 이 구문은 가져오기 프로세스에서 제외할 행을 명확하게 지정하여 인수 동작에 대한 혼란을 제거합니다.

위 내용은 Pandas로 CSV 파일을 가져올 때 특정 행을 건너뛰는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.