>  기사  >  백엔드 개발  >  `df.to_numpy()`를 사용하여 누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환하고 데이터 유형을 보존하려면 어떻게 해야 합니까?

`df.to_numpy()`를 사용하여 누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환하고 데이터 유형을 보존하려면 어떻게 해야 합니까?

Linda Hamilton
Linda Hamilton원래의
2024-11-06 03:57:02731검색

How can I convert a Pandas DataFrame with missing values into a NumPy array using `df.to_numpy()` and preserve data types?

누락된 값이 있는 Pandas 데이터 프레임을 NumPy 배열로 변환

df.to_numpy() 사용

누락된 값이 있는 Pandas 데이터 프레임을 NumPy로 변환하려면 누락된 값을 나타내는 np.nan이 있는 배열의 경우 df.to_numpy() 메서드를 사용하세요. 이는 데이터프레임과 인덱스/시리즈 개체 모두에서 NumPy 배열을 얻는 일관되고 안정적인 방법을 제공합니다.

<code class="python">import numpy as np
import pandas as pd

df = pd.DataFrame({
    "A": [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1],
    "B": [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan],
    "C": [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan],
}, index=[1, 2, 3, 4, 5, 6, 7])

np_array = df.to_numpy()
print(np_array)</code>

이렇게 하면 np.nan으로 표시되는 누락된 값이 있는 NumPy 배열이 출력됩니다.

[[ nan  0.2  nan]
 [ nan  nan  0.5]
 [ nan  0.2  0.5]
 [ 0.1  0.2  nan]
 [ 0.1  0.2  0.5]
 [ 0.1  nan  0.5]
 [ 0.1  nan  nan]]

데이터 유형 보존

NumPy 배열의 데이터 유형을 보존하려면 np.rec.fromrecords() 함수를 사용하십시오.

<code class="python">v = df.reset_index()
np_array_dtypes = np.rec.fromrecords(v, names=v.columns.tolist())
print(np_array_dtypes)</code>

이렇게 하면 원본과 함께 NumPy 배열이 출력됩니다. 다음과 같이 보존되는 데이터 유형:

rec.array([('1', 1, 0.2, 0.5), ('2', 2, np.nan, 0.5), ('3', 3, 0.2, 0.5),
           ('4', 4, 0.2, np.nan), ('5', 5, 0.2, 0.5), ('6', 6, np.nan, 0.5),
           ('7', 7, np.nan, np.nan)],
          dtype=[('index', '<U1'), ('A', '<f8'), ('B', '<f8'), ('C', '<f8')])

위 내용은 `df.to_numpy()`를 사용하여 누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환하고 데이터 유형을 보존하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.