집 >백엔드 개발 >파이썬 튜토리얼 >`df.to_numpy()`를 사용하여 누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환하고 데이터 유형을 보존하려면 어떻게 해야 합니까?

`df.to_numpy()`를 사용하여 누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환하고 데이터 유형을 보존하려면 어떻게 해야 합니까?

Linda Hamilton원래의: 2024-11-06 03:57:02986검색

How can I convert a Pandas DataFrame with missing values into a NumPy array using `df.to_numpy()` and preserve data types?

누락된 값이 있는 Pandas 데이터 프레임을 NumPy 배열로 변환

df.to_numpy() 사용

누락된 값이 있는 Pandas 데이터 프레임을 NumPy로 변환하려면 누락된 값을 나타내는 np.nan이 있는 배열의 경우 df.to_numpy() 메서드를 사용하세요. 이는 데이터프레임과 인덱스/시리즈 개체 모두에서 NumPy 배열을 얻는 일관되고 안정적인 방법을 제공합니다.

<code class="python">import numpy as np
import pandas as pd

df = pd.DataFrame({
    "A": [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1],
    "B": [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan],
    "C": [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan],
}, index=[1, 2, 3, 4, 5, 6, 7])

np_array = df.to_numpy()
print(np_array)</code>

이렇게 하면 np.nan으로 표시되는 누락된 값이 있는 NumPy 배열이 출력됩니다.

[[ nan  0.2  nan]
 [ nan  nan  0.5]
 [ nan  0.2  0.5]
 [ 0.1  0.2  nan]
 [ 0.1  0.2  0.5]
 [ 0.1  nan  0.5]
 [ 0.1  nan  nan]]

데이터 유형 보존

NumPy 배열의 데이터 유형을 보존하려면 np.rec.fromrecords() 함수를 사용하십시오.

<code class="python">v = df.reset_index()
np_array_dtypes = np.rec.fromrecords(v, names=v.columns.tolist())
print(np_array_dtypes)</code>

이렇게 하면 원본과 함께 NumPy 배열이 출력됩니다. 다음과 같이 보존되는 데이터 유형:

rec.array([('1', 1, 0.2, 0.5), ('2', 2, np.nan, 0.5), ('3', 3, 0.2, 0.5),
           ('4', 4, 0.2, np.nan), ('5', 5, 0.2, 0.5), ('6', 6, np.nan, 0.5),
           ('7', 7, np.nan, np.nan)],
          dtype=[('index', '<U1'), ('A', '<f8'), ('B', '<f8'), ('C', '<f8')])

위 내용은 `df.to_numpy()`를 사용하여 누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환하고 데이터 유형을 보존하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

numpy pandas Array using function this

성명：

이전 기사：Python을 사용하여 모니터 해상도를 결정하는 방법은 무엇입니까?다음 기사：Python을 사용하여 모니터 해상도를 결정하는 방법은 무엇입니까?