>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrame을 NumPy 배열로 효율적으로 변환하는 방법은 무엇입니까?

Pandas DataFrame을 NumPy 배열로 효율적으로 변환하는 방법은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-12-14 17:24:10867검색

How to Efficiently Convert a Pandas DataFrame to a NumPy Array?

Pandas 데이터프레임을 NumPy 배열로 변환

Pandas 데이터프레임을 NumPy 배열로 변환하려면 df.to_numpy() 메서드를 사용하는 것이 좋습니다. 이 접근 방식은 아래에 자세히 설명된 것처럼 여러 가지 이유로 df.values보다 선호됩니다.

df.to_numpy()

사용

df.to_numpy() 호출 이 방법을 사용하면 기본 NumPy 배열을 추출할 수 있습니다. dataframe.

import numpy as np
import pandas as pd

index = [1, 2, 3, 4, 5, 6, 7]
a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1]
b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan]
c = [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan]
df = pd.DataFrame({'A': a, 'B': b, 'C': c}, index=index)
df = df.rename_axis('ID')

arr = df.to_numpy()
print(arr)

출력:

[[ nan  0.2  nan]
 [ nan  nan  0.5]
 [ nan  0.2  0.5]
 [ 0.1  0.2  nan]
 [ 0.1  0.2  0.5]
 [ 0.1  nan  0.5]
 [ 0.1  nan  nan]]

Dtype 보존

결과에서 데이터 유형을 유지하는 것이 목표인 경우 NumPy 배열의 가능한 접근 방식은 다음과 같이 DataFrame.to_records()를 활용하는 것입니다. 아래:

records_array = df.to_records()
print(records_array)

출력:

rec.array([('a', 1, 4, 7), ('b', 2, 5, 8), ('c', 3, 6, 9)],
           dtype=[('ID', '<U1'), ('A', '<i8'), ('B', '<i8'), ('C', '<i8')])

대안으로 np.rec.fromrecords를 사용할 수 있습니다:

v = df.reset_index()
records_array = np.rec.fromrecords(v, names=v.columns.tolist())
print(records_array)

출력:

rec.array([('a', 1, 4, 7), ('b', 2, 5, 8), ('c', 3, 6, 9)],
           dtype=[('index', '<U1'), ('A', '<i8'), ('B', '<i8'), ('C', '<i8')])

이러한 방법 중 하나를 사용하면 NumPy에서 데이터 유형이 보존됩니다. 배열.

위 내용은 Pandas DataFrame을 NumPy 배열로 효율적으로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.