ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame を NumPy 配列に効率的に変換するにはどうすればよいですか?

Pandas DataFrame を NumPy 配列に効率的に変換するにはどうすればよいですか?

Linda Hamilton
Linda Hamiltonオリジナル
2024-12-14 17:24:10871ブラウズ

How to Efficiently Convert a Pandas DataFrame to a NumPy Array?

Pandas データフレームを NumPy 配列に変換する

パンダ データフレームを NumPy 配列に変換するには、df.to_numpy() メソッドを使用することをお勧めします。以下で詳しく説明するように、このアプローチは df.values よりも望ましい方法です。

df.to_numpy() の使用

df.to_numpy() の呼び出しこのメソッドを使用すると、基になる NumPy 配列をdataframe.

import numpy as np
import pandas as pd

index = [1, 2, 3, 4, 5, 6, 7]
a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1]
b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan]
c = [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan]
df = pd.DataFrame({'A': a, 'B': b, 'C': c}, index=index)
df = df.rename_axis('ID')

arr = df.to_numpy()
print(arr)

出力:

[[ nan  0.2  nan]
 [ nan  nan  0.5]
 [ nan  0.2  0.5]
 [ 0.1  0.2  nan]
 [ 0.1  0.2  0.5]
 [ 0.1  nan  0.5]
 [ 0.1  nan  nan]]

Preserving Dtypes

結果のデータ型を維持することが目的の場合NumPy 配列の場合、考えられるアプローチには、次のように DataFrame.to_records() を利用することが含まれます。以下:

records_array = df.to_records()
print(records_array)

出力:

rec.array([('a', 1, 4, 7), ('b', 2, 5, 8), ('c', 3, 6, 9)],
           dtype=[('ID', '<U1'), ('A', '<i8'), ('B', '<i8'), ('C', '<i8')])

代わりに、np.rec.fromrecords:

v = df.reset_index()
records_array = np.rec.fromrecords(v, names=v.columns.tolist())
print(records_array)

出力:

rec.array([('a', 1, 4, 7), ('b', 2, 5, 8), ('c', 3, 6, 9)],
           dtype=[('index', '<U1'), ('A', '<i8'), ('B', '<i8'), ('C', '<i8')])

これらのメソッドのいずれかを使用すると、NumPy 内のデータ型が確実に保持されます。配列。

以上がPandas DataFrame を NumPy 配列に効率的に変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。