可変長の配列を含むディクショナリからのデータフレームの作成
ここでの課題は、可変長の numpy 配列で構成される列を含むデータフレームを生成することです辞書から抽出された値。これを実現するには、Python を使用したソリューションを検討してみましょう。
Python 3.x 以降では、次のコード スニペットを使用できます。
import pandas as pd import numpy as np # Define a dictionary with key-value pairs representing numpy arrays d = { "A": np.random.randn(10), "B": np.random.randn(12), "C": np.random.randn(8) } # Create a dataframe by converting each key-value pair to a series df = pd.DataFrame( dict([ (k, pd.Series(v)) for k, v in d.items() ]) ) # Display the resulting dataframe print(df)
このコードは、列を持つデータフレームを作成します。 A、"B"、および "C" は、それぞれ辞書からの対応する numpy 配列値を保持します。配列の長さが異なる場合は、自動的に整列され、NaN 値をパディングとして短い配列を拡張します。
Python 2.x では、若干の変更が必要です。
import pandas as pd import numpy as np # Define a dictionary with key-value pairs representing numpy arrays d = { "A": np.random.randn(10), "B": np.random.randn(12), "C": np.random.randn(8) } # Create a dataframe by converting each key-value pair to a series df = pd.DataFrame( dict([ (k, pd.Series(v)) for k, v in d.iteritems() ]) ) # Display the resulting dataframe print(df)
Python の場合2.x では、items() の代わりに iteritems() 関数を使用して、キーと値のペアを反復処理します。
このアプローチを利用すると、異なる長さの配列を含む列を含むデータフレームを簡単に作成でき、データが適切に配置されて処理されるようにすることができます。
以上がさまざまな長さの配列を含むディクショナリから Pandas データフレームを作成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。