大きな Pandas DataFrame の分割
423244 行で構成される大きな Pandas DataFrame を考えます。この DataFrame を 4 つの等しい部分に分割する必要があります。ただし、np.split(df, 4) を使用しようとすると、「ValueError: 配列分割では等分割が発生しません」エラーがスローされます。
この問題に対処するには、np.array_split を使用する必要があります。 np.split とは異なり、np.array_split では、等軸分割を生成しない整数を indices_or_sections にすることができます。
<code class="python">import pandas as pd import numpy as np # Create a DataFrame df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], 'C': np.random.randn(8), 'D': np.random.randn(8)}) # Split the DataFrame into three equal parts result = np.array_split(df, 3) # Print the results for i in range(len(result)): print(f"Part {i + 1}:") print(result[i]) print()</code>
このコードは、DataFrame を 3 つのほぼ等しい部分に分割します。必要に応じてパーツの数を調整できます。
以上が大きな Pandas DataFrame を等しい部分に分割するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。