CSV 가져오기를 위한 Pandas의 행 건너뛰기 인수 해석
pandas.read_csv()를 사용하여 CSV 파일을 DataFrame으로 가져올 때 다음을 수행할 수 있습니다. 가져오기 프로세스에서 특정 행을 제외하려는 상황이 발생합니다. Skiprows 인수는 이 기능을 제공하지만 구문이 모호할 수 있습니다.
모호함 이해
pandas 문서에는 Skiprow가 행 번호 목록( 0-인덱스) 또는 파일 시작 부분에서 건너뛸 행 수를 나타내는 정수입니다. 이러한 모호함은 인덱스 1이 있는 행과 같이 특정 행을 건너뛰려고 할 때 혼란을 초래할 수 있습니다.
동작 결정
skiprow의 동작을 명확히 하려면 , 다음 시나리오를 고려하십시오.
예시 데모
동작을 살펴보겠습니다. StringIO 객체 사용:
<code class="python">import pandas as pd from io import StringIO s = "1, 2\n3, 4\n5, 6" # Skipping the first row df1 = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skipping the row with index 1 df2 = pd.read_csv(StringIO(s), skiprows=1, header=None) print(df1) print(df2)</code>
출력:
0 1 0 1 2 1 5 6 0 1 0 3 4 1 5 6
보시다시피, Skiprows=[1]은 두 번째 행(인덱스 1)을 건너뛰고, Skiprows=1은 첫 번째 행.
결론
pandas.read_csv()를 사용하여 CSV를 가져오는 동안 특정 행을 건너뛰려면 Skiprows=[row_index] 구문을 사용하세요. 이 구문은 가져오기 프로세스에서 제외할 행을 명확하게 지정하여 인수 동작에 대한 혼란을 제거합니다.
위 내용은 Pandas로 CSV 파일을 가져올 때 특정 행을 건너뛰는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!