ホームページ >バックエンド開発 >Python チュートリアル >Pandas の「concat」関数の「levels」、「keys」、「names」の引数は、DataFrame での MultiIndex 構造の作成とカスタマイズにどのように役立ちますか?

Pandas の「concat」関数の「levels」、「keys」、「names」の引数は、DataFrame での MultiIndex 構造の作成とカスタマイズにどのように役立ちますか?

DDD
DDDオリジナル
2024-10-27 04:12:30285ブラウズ

How do the 'levels', 'keys', and 'names' arguments in Pandas' `concat` function help create and customize MultiIndex structures in DataFrames?

Pandas の concat 関数の「レベル」、「キー」、および名前引数とは何ですか?

概要

pandas.concat () 関数は、複数の Series または DataFrame オブジェクトを 1 つの統合された DataFrame に結合するための多用途ツールです。レベル、キー、名前の引数など、連結プロセスをカスタマイズするためのいくつかの引数が提供されます。このガイドでは、これらの引数について、その使用法を示す例とともに包括的に説明します。

concat() 関数の使用

pandas.concat() 関数の構文は次のとおりです。

<code class="python">pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True)</code>

次のコード スニペットは、インデックス軸に沿って 2 つの DataFrame を連結する簡単な例を示しています。

<code class="python">import pandas as pd

df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})

df = pd.concat([df1, df2])

print(df)</code>

出力:

   A  B
0  1  4
1  2  5
2  3  6
3  7  10
4  8  11
5  9  12

キー Argument

keys 引数を使用すると、スカラー値またはタプルのリストを指定して、結果のデータフレームに MultiIndex 構造を作成できます。キー リストの各要素は、連結されるオブジェクトの 1 つに対応します。

たとえば、次のコード スニペットを考えてみましょう。

<code class="python">keys = ['df1', 'df2']
df = pd.concat([df1, df2], keys=keys)

print(df)</code>

出力:

    A  B
df1 0  1  4
    1  2  5
    2  3  6
df2 3  7  10
    4  8  11
    5  9  12

Keys 引数は、「keys」という名前の新しいレベルをインデックスに作成します。これにより、どの行がどの DataFrame に属しているかを簡単に識別できます。

Levels 引数

Levels 引数は、使用する MultiIndex の特定のレベルを指定するために使用されます。シーケンスのリストが必要で、各シーケンスは MultiIndex 内のレベルを表します。

たとえば、次のコードは、MultiIndex に 2 つのレベルがあることを指定します。

<code class="python">levels = [['df1', 'df2'], ['A', 'B']]
df = pd.concat([df1, df2], keys=keys, levels=levels)

print(df)</code>

出力:

    A  B
df1 A 0  1  4
   B 1  2  5
   C 2  3  6
df2 A 3  7  10
   B 4  8  11
   C 5  9  12

levels 引数を使用すると、より複雑な MultiIndex 構造を柔軟に作成できます。

names 引数

names 引数を使用すると、MultiIndex のレベルのカスタム名を指定できます。文字列のリストが必要です。各文字列はレベルの名前を表します。

<code class="python">names = ['DataFrame', 'Column']
df = pd.concat([df1, df2], keys=keys, levels=levels, names=names)

print(df)</code>

出力:

DataFrame Column  A  B
df1        A   0  1  4
            B   1  2  5
            C   2  3  6
df2        A   3  7  10
           B   4  8  11
           C   5  9  12

names 引数は、MultiIndex 構造を扱うときにコンテキストを提供し、読みやすさを向上させるのに役立ちます。 .

結論

レベル、キー、および名前の引数は、パンダの連結プロセスをカスタマイズするための強力なツールです。これらを使用すると、データの分析と操作を容易にする、柔軟で有益な MultiIndex 構造を作成できます。これらの引数の使用法を理解することで、pandas プログラミング スキルを向上させ、データを効果的に管理できます。

以上がPandas の「concat」関数の「levels」、「keys」、「names」の引数は、DataFrame での MultiIndex 構造の作成とカスタマイズにどのように役立ちますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。