使用Pandas 匯入CSV 時跳過行
使用Pandas 匯入CSV 資料時,通常需要跳過不需要的行包含在您的分析中。然而,圍繞skiprows參數的歧義可能會令人困惑。
skiprows的語法如下:
skiprows : list-like or integer Row numbers to skip (0-indexed) or number of rows to skip (int) at the start of the file.
問題出現了:Pandas如何知道是否跳過第一行或當指定skiprows=1 時索引為1 的行?
為了解決這個問題,讓我們使用包含三行的範例CSV 檔案執行一個實驗:
1, 2 3, 4 5, 6
跳過行索引為1
如果要跳過索引為1 的行,請將跳行作為列表傳遞:
<code class="python">import pandas as pd from io import StringIO s = """1, 2 ... 3, 4 ... 5, 6""" df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skip row with index 1 print(df)</code>
輸出:
0 1 0 1 2 1 5 6
跳過行數
要跳過特定數量的行(在本例中為1),請將skiprows 作為整數傳遞:
<code class="python">df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Skip the first row print(df)</code>
輸出:
0 1 0 3 4 1 5 6
因此,很明顯,skiprows 參數的行為會有所不同,這取決於您提供的是列表還是整數。如果您想按索引跳過一行,請使用清單。否則,使用整數從檔案開頭跳過指定行數。
以上是Pandas 中的「skiprows」如何知道是否要跳過第一行或索引為 1 的行?的詳細內容。更多資訊請關注PHP中文網其他相關文章!