CSV 파일을 Python으로 가져오는 것은 일반적인 작업이며 Pandas는 데이터 조작 및 분석에 널리 사용되는 라이브러리입니다. 그러나 가져오기 프로세스 중에 특정 행을 건너뛰어야 하는 상황이 발생할 수 있습니다.
이를 달성하기 위해 Pandas는 read_csv() 함수에 Skiprows 매개변수를 제공합니다. 그러나 문서가 모호해 보일 수 있으므로 건너뛸 행을 올바르게 지정하는 방법이 궁금할 수 있습니다.
skiprows 매개변수 이해
skiprows 매개변수는 다음 중 하나의 목록을 허용합니다. 행 번호(0부터 인덱스) 또는 파일 시작 부분에서 건너뛸 행 수를 나타내는 정수입니다. Pandas는 제공하는 값의 형식에 따라 두 가지 해석을 모두 허용하기 때문에 혼란이 발생합니다.
예
차이점을 설명하려면 다음 CSV 파일을 고려하세요.
<code class="csv">1, 2 3, 4 5, 6</code>
두 번째 행을 건너뛰려면(인덱스 1 사용):
<code class="python">import pandas as pd # Skip row with index 1 data = pd.read_csv("data.csv", skiprows=[1]) # Print the data print(data)</code>
이 결과는 다음과 같습니다.
0 1 0 1 2 1 5 6
첫 번째 행을 건너뛰려면:
<code class="python">import pandas as pd # Skip first row data = pd.read_csv("data.csv", skiprows=1) # Print the data print(data)</code>
이 결과는 다음과 같습니다.
0 1 0 3 4 1 5 6
Pandas.read_csv()에서 건너뛴 행을 지정하는 다양한 방법을 이해하면 데이터를 효율적으로 가져오고 특정 행을 제외해야 하는 특정 시나리오를 처리할 수 있습니다.
위 내용은 Pandas를 사용하여 CSV 파일을 가져올 때 특정 행을 건너뛰는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!