ホームページ >バックエンド開発 >Python チュートリアル >Pandas でデータをロング形式からワイド形式に再形成する方法: ステップバイステップ ガイド
Pandas での長いデータから広いデータへの再構成: 包括的なガイド
多くのデータセットは、最初は長い形式で保存され、各行は単一の観測値と複数の変数が列としてリストされます。ただし、多くの場合、データをワイド形式に再形成する必要が生じます。各行は、2 つ以上の変数の値の一意の組み合わせに対応します。
問題: ロング データからワイド データへの変換Pandas では、特にメルト/スタック/アンスタック メソッドを使用する場合、フォーマットは面倒な作業になる可能性があります。たとえば、次のロングフォーマット データフレームを考えてみましょう:
<code class="python">import pandas as pd data = pd.DataFrame({ 'Salesman': ['Knut', 'Knut', 'Knut', 'Steve'], 'Height': [6, 6, 6, 5], 'product': ['bat', 'ball', 'wand', 'pen'], 'price': [5, 1, 3, 2] })</code>
ワイド フォーマットへの再形成:
データをワイド フォーマットに再形成するには、Chris Albon の解決策:
長いデータフレームを作成:
<code class="python">raw_data = { 'patient': [1, 1, 1, 2, 2], 'obs': [1, 2, 3, 1, 2], 'treatment': [0, 1, 0, 1, 0], 'score': [6252, 24243, 2345, 2342, 23525] } df = pd.DataFrame(raw_data, columns=['patient', 'obs', 'treatment', 'score'])</code>
幅広に変形:
<code class="python">df.pivot(index='patient', columns='obs', values='score')</code>
これにより、目的のワイドフォーマット データフレーム:
<code class="python">obs 1 2 3 patient 1 6252.0 24243.0 2345.0 2 2342.0 23525.0 NaN</code>
以上がPandas でデータをロング形式からワイド形式に再形成する方法: ステップバイステップ ガイドの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。