Pandas での CSV インポート中に行をスキップする
pandas.read_csv() を使用して CSV データをインポートする場合、特定の行をスキップしたい場合があります。 。ただし、skiprows パラメータはリストと整数の両方を受け入れるため、混乱を招く可能性があります。
skiprows パラメータを使用すると、ファイルの先頭からスキップする行を指定できます。行番号のリストを指定すると、それらの行はスキップされます。整数を指定すると、その行数がスキップされます。
たとえば、CSV ファイルの 2 行目に不要なデータが含まれており、それをスキップしたい場合は、次のいずれかを使用できます。メソッド:
リストとしての Skiprow (推奨)
<code class="python">import pandas as pd from io import StringIO s = """1, 2 3, 4 5, 6""" # Skip the second row using a list df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Output: Row with index 1 skipped print(df)</code>
整数としての Skiprow
<code class="python"># Skip the second row using an integer df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Output: Row with index 1 skipped print(df)</code>
注Skiprows=1 を使用すると最初の行がスキップされ、skiprows=[1] ではインデックス 1 の行がスキップされます。これは、Python が 0 ベースのインデックスを使用し、リストの最初の要素のインデックスが 0 であるためです。
結論
skiprows パラメーターの動作を理解することで、pandas を使用した CSV インポート中に不要な行を効果的にスキップできます。
以上がPandas CSVインポートで行をスキップするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。