CSV インポートのための Pandas のスキップ行引数の解釈
pandas.read_csv() を使用して CSV ファイルを DataFrame にインポートする場合、次のようにすることができます。インポート プロセスから特定の行を除外したい場合があります。 Skiprows 引数はこの機能を提供しますが、構文があいまいになる可能性があります。
曖昧さの理解
パンダのドキュメントには、skiprows は行番号のリスト ( 0 からインデックス付き)、またはファイルの先頭からスキップする行数を表す整数。このあいまいさは、インデックス 1 の行など、特定の行をスキップする場合に混乱を招く可能性があります。
動作の決定
スキップロウの動作を明確にするには、次のことを考慮してくださいシナリオ:
デモの例
StringIO オブジェクトを使用して動作を説明しましょう:
<code class="python">import pandas as pd from io import StringIO s = "1, 2\n3, 4\n5, 6" # Skipping the first row df1 = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skipping the row with index 1 df2 = pd.read_csv(StringIO(s), skiprows=1, header=None) print(df1) print(df2)</code>
出力:
0 1 0 1 2 1 5 6 0 1 0 3 4 1 5 6
ご覧のとおり、skiprows=[1] は 2 行目をスキップします(インデックス 1)、skiprows=1 は最初の行をスキップします。
結論
pandas.read_csv() を使用した CSV インポート中に特定の行をスキップするには、 Skiprows=[row_index] 構文。この構文は、インポート プロセスから除外する行を明確に指定し、引数の動作に関する混乱を排除します。
以上がPandas で CSV ファイルをインポートするときに特定の行をスキップする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。