CSV ファイルを Python にインポートするのは一般的なタスクであり、Pandas はデータの操作と分析用の人気のあるライブラリです。ただし、インポート プロセス中に特定の行をスキップする必要がある状況が発生する場合があります。
これを実現するために、Pandas は read_csv() 関数で Skiprows パラメーターを提供します。ただし、ドキュメントがあいまいで、スキップする行を正しく指定する方法が分からないかもしれません。
skiprows パラメータについて
skiprows パラメータは、次のリストのいずれかを受け入れます。行番号 (0 から始まるインデックス)、またはファイルの先頭からスキップする行数を表す整数。 Pandas では、指定した値の形式に応じて両方の解釈が許可されるため、混乱が生じます。
例
違いを説明するために、次の CSV ファイルを考えてみましょう:
<code class="csv">1, 2 3, 4 5, 6</code>
2 行目をスキップするには (インデックス 1):
<code class="python">import pandas as pd # Skip row with index 1 data = pd.read_csv("data.csv", skiprows=[1]) # Print the data print(data)</code>
これ次のように出力されます:
0 1 0 1 2 1 5 6
最初の行をスキップするには:
<code class="python">import pandas as pd # Skip first row data = pd.read_csv("data.csv", skiprows=1) # Print the data print(data)</code>
これは次のように出力します:
0 1 0 3 4 1 5 6
スキップされた行を指定するさまざまな方法を理解することで、 Pandas.read_csv() を使用すると、データを効率的にインポートし、特定の行の除外が必要な特定のシナリオを処理できます。
以上がPandas を使用して CSV ファイルをインポートするときに特定の行をスキップする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。