ホームページ >バックエンド開発 >Python チュートリアル >np.array_split を使用して、大きな Pandas データフレームを不均等な分割で複数のグループに分割する方法
np.array_split を使用して大規模な Pandas データフレームを複数のグループに分割する方法
大規模なデータフレームを扱う場合、分割が必要になる場合がありますそれらをより小さく、より管理しやすい塊に分割します。これにより、より効率的な処理と分析が可能になります。データフレームを分割する方法の 1 つは、np.split() 関数を使用することです。ただし、この関数は、データフレームが必要な分割数で均等に割り切れない場合に問題が発生する可能性があります。
この状況に対するより適切な代替方法は、np.array_split() 関数を使用することです。この関数を使用すると、indices_or_sections パラメータを軸を均等に分割しない整数にすることができます。
<code class="python">import pandas as pd import numpy as np # Create a large dataframe df = pd.DataFrame(...) # Define the number of groups to split the dataframe into n_groups = 4 # Split the dataframe using np.array_split() dataframe_chunks = np.array_split(df, n_groups) # Iterate over the dataframe chunks and print their contents for item in dataframe_chunks: print(item)</code>
追加メモ:
以上がnp.array_split を使用して、大きな Pandas データフレームを不均等な分割で複数のグループに分割する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。