解释 Pandas 的 CSV 导入的跳行参数
使用 pandas.read_csv() 将 CSV 文件导入到 DataFrame 时,您可以遇到您想要从导入过程中排除特定行的情况。 Skiprows 参数提供了此功能,但其语法可能不明确。
理解歧义
pandas 文档指出,skiprows 可以接受行号列表( 0 索引)或表示从文件开头跳过的行数的整数。当您想要跳过特定行(例如索引为 1 的行)时,这种歧义可能会导致混乱。
确定行为
澄清跳过行的行为,考虑以下场景:
示例演示
让我们来说明一下行为使用 StringIO 对象:
<code class="python">import pandas as pd from io import StringIO s = "1, 2\n3, 4\n5, 6" # Skipping the first row df1 = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skipping the row with index 1 df2 = pd.read_csv(StringIO(s), skiprows=1, header=None) print(df1) print(df2)</code>
输出:
0 1 0 1 2 1 5 6 0 1 0 3 4 1 5 6
如您所见,skiprows=[1] 跳过第二行(索引 1),而skiprows=1 跳过第二行第一行。
结论
要在使用 pandas.read_csv() 导入 CSV 期间跳过特定行,请使用skiprows=[row_index] 语法。此语法明确指定要从导入过程中排除的行,从而消除了对参数行为的任何混淆。
以上是使用 Pandas 导入 CSV 文件时如何跳过特定行?的详细内容。更多信息请关注PHP中文网其他相关文章!