집 >백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrame을 NumPy 배열로 효율적으로 변환하는 방법은 무엇입니까?

Pandas DataFrame을 NumPy 배열로 효율적으로 변환하는 방법은 무엇입니까?

Linda Hamilton원래의: 2024-12-14 17:24:10929검색

How to Efficiently Convert a Pandas DataFrame to a NumPy Array?

Pandas 데이터프레임을 NumPy 배열로 변환

Pandas 데이터프레임을 NumPy 배열로 변환하려면 df.to_numpy() 메서드를 사용하는 것이 좋습니다. 이 접근 방식은 아래에 자세히 설명된 것처럼 여러 가지 이유로 df.values보다 선호됩니다.

df.to_numpy()

사용

df.to_numpy() 호출 이 방법을 사용하면 기본 NumPy 배열을 추출할 수 있습니다. dataframe.

import numpy as np
import pandas as pd

index = [1, 2, 3, 4, 5, 6, 7]
a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1]
b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan]
c = [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan]
df = pd.DataFrame({'A': a, 'B': b, 'C': c}, index=index)
df = df.rename_axis('ID')

arr = df.to_numpy()
print(arr)

출력:

[[ nan  0.2  nan]
 [ nan  nan  0.5]
 [ nan  0.2  0.5]
 [ 0.1  0.2  nan]
 [ 0.1  0.2  0.5]
 [ 0.1  nan  0.5]
 [ 0.1  nan  nan]]

Dtype 보존

결과에서 데이터 유형을 유지하는 것이 목표인 경우 NumPy 배열의 가능한 접근 방식은 다음과 같이 DataFrame.to_records()를 활용하는 것입니다. 아래:

records_array = df.to_records()
print(records_array)

출력:

rec.array([('a', 1, 4, 7), ('b', 2, 5, 8), ('c', 3, 6, 9)],
           dtype=[('ID', '<U1'), ('A', '<i8'), ('B', '<i8'), ('C', '<i8')])

대안으로 np.rec.fromrecords를 사용할 수 있습니다:

v = df.reset_index()
records_array = np.rec.fromrecords(v, names=v.columns.tolist())
print(records_array)

출력:

rec.array([('a', 1, 4, 7), ('b', 2, 5, 8), ('c', 3, 6, 9)],
           dtype=[('index', '<U1'), ('A', '<i8'), ('B', '<i8'), ('C', '<i8')])

이러한 방법 중 하나를 사용하면 NumPy에서 데이터 유형이 보존됩니다. 배열.

위 내용은 Pandas DataFrame을 NumPy 배열로 효율적으로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

numpy pandas Array if for using this transform

성명：

이전 기사：Python의 목록 분할이 할당에 어떤 영향을 미칩니까?다음 기사：Python의 목록 분할이 할당에 어떤 영향을 미칩니까?