解釋Pandas 的CSV 匯入的跳行參數
使用pandas.read_csv() 將CSV 檔案匯入到DataFrame 時,您可以被匯入到您想要從匯入過程中排除特定行的情況。 Skiprows 參數提供了此功能,但其語法可能不明確。
理解歧義
pandas 文件指出,skiprows 可以接受行號列表( 0 索引)或表示從文件開頭跳過的行數的整數。當您想要跳過特定行(例如索引為 1 的行)時,這種歧義可能會導致混亂。
確定行為
澄清跳過行的行為,考慮以下場景:
示例演示
讓我們來說明一下行為使用StringIO 對象:
<code class="python">import pandas as pd from io import StringIO s = "1, 2\n3, 4\n5, 6" # Skipping the first row df1 = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skipping the row with index 1 df2 = pd.read_csv(StringIO(s), skiprows=1, header=None) print(df1) print(df2)</code>
輸出:
0 1 0 1 2 1 5 6 0 1 0 3 4 1 5 6
如您所見,skiprows=[1] 跳過第二行(索引1),而skiprows=1 跳過第二行第一行。
結論
要在使用 pandas.read_csv() 匯入 CSV 期間跳過特定行,請使用skiprows=[row_index] 語法。此語法明確指定要從匯入過程中排除的行,從而消除了對參數行為的任何混淆。
以上是使用 Pandas 匯入 CSV 檔案時如何跳過特定行?的詳細內容。更多資訊請關注PHP中文網其他相關文章!