Pandas で 2 つのデータフレームの行を連結する: ガイド
Pandas でデータを操作する場合、次のことが必要になる場合がよくあります。複数のソースからのデータを結合します。これはさまざまな方法で実現できますが、その 1 つが連結です。連結により、データフレームの水平方向の位置合わせと結合が可能になり、データの包括的なビューが表示されます。
2 つのデータフレームの行の連結
2 つのデータフレーム内の行を連結するプロセス、 df_a と df_b は簡単です。 concat 関数を呼び出して axis=1 を指定すると、データフレームを列方向に連結でき、その結果、df_a と df_b の両方と同じ行数 (nRow) と、その数の合計に等しい列数を持つデータフレームが得られます。
次の例を考えてみましょう。
<code class="python">dict_data = {'Treatment': ['C', 'C', 'C'], 'Biorep': ['A', 'A', 'A'], 'Techrep': [1, 1, 1], 'AAseq': ['ELVISLIVES', 'ELVISLIVES', 'ELVISLIVES'], 'mz':[500.0, 500.5, 501.0]} df_a = pd.DataFrame(dict_data) dict_data = {'Treatment1': ['C', 'C', 'C'], 'Biorep1': ['A', 'A', 'A'], 'Techrep1': [1, 1, 1], 'AAseq1': ['ELVISLIVES', 'ELVISLIVES', 'ELVISLIVES'], 'inte1':[1100.0, 1050.0, 1010.0]} df_b = pd.DataFrame(dict_data)</code>
これらのデータフレームを水平方向に連結するには、次のコードを使用します。
<code class="python">pd.concat([df_a,df_b], axis=1)</code>
結果データフレームは次の構造になります。
<code class="python"> AAseq Biorep Techrep Treatment mz AAseq1 Biorep1 Techrep1 \ 0 ELVISLIVES A 1 C 500.0 ELVISLIVES A 1 1 ELVISLIVES A 1 C 500.5 ELVISLIVES A 1 2 ELVISLIVES A 1 C 501.0 ELVISLIVES A 1 Treatment1 inte1 0 C 1100 1 C 1050 2 C 1010 </code>
代替メソッド
連結に加えて、データフレームを結合するために使用できる代替メソッドがあります。これらのメソッドには、マージと結合が含まれます。
マージ
データフレームのマージでは、特定の列またはキーに基づいてデータフレームが結合されます。これは、データフレームが共通の列を共有しており、その列に基づいてデータを結合する場合に便利です。同じ行数を持つ上記のデータフレーム df_a と df_b の場合、次のようにインデックスを使用してそれらをマージできます。
<code class="python">df_a.merge(df_b, left_index=True, right_index=True)</code>
Joining
Joining dataframes は結合に似ていますが、特定の列に基づいてデータフレームを結合するのではなく、行の位置に基づいてデータフレームを結合します。繰り返しますが、行数が同じで重複するインデックスがない df_a と df_b の場合、次のように結合できます。
<code class="python">df_a.join(df_b)</code>
どの方法を使用するかの選択は、特定のデータの要件によって異なります。分析タスク。連結、マージ、結合はすべて、データフレームを結合する便利な方法を提供し、さまざまなシナリオを処理する柔軟性を提供します。
以上がPandas で 2 つの DataFrame の行を連結するにはどうすればよいですか?また、データフレームを結合するための代替方法はありますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。