>  기사  >  백엔드 개발  >  누락된 값이 있는 Pandas DataFrame을 NaN을 유지하는 NumPy 배열로 변환하는 방법은 무엇입니까?

누락된 값이 있는 Pandas DataFrame을 NaN을 유지하는 NumPy 배열로 변환하는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-11-05 02:27:02552검색

How to Convert a Pandas DataFrame with Missing Values to a NumPy Array Preserving NaN?

누락된 값이 있는 Pandas 데이터 프레임을 NumPy 배열로 변환

문제

누락된 값이 있는 Pandas 데이터 프레임을 NumPy 배열로 변환하고 누락된 값을 유지합니다. np.nan으로. 다음 데이터 프레임을 고려하십시오.

<code class="python">index = [1, 2, 3, 4, 5, 6, 7]
a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1]
b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan]
c = [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan]
df = pd.DataFrame({'A': a, 'B': b, 'C': c}, index=index)
df = df.rename_axis('ID')

print(df)</code>

출력:

      A    B    C
ID
1   NaN  0.2  NaN
2   NaN  NaN  0.5
3   NaN  0.2  0.5
4   0.1  0.2  NaN
5   0.1  0.2  0.5
6   0.1  NaN  0.5
7   0.1  NaN  NaN

df.to_numpy()를 사용한 솔루션

to_numpy() 메서드를 사용하여 데이터 프레임을 np.nan으로 표현된 누락된 값이 있는 NumPy 배열:

<code class="python">import numpy as np
import pandas as pd

np_array = df.to_numpy()

print(np_array)</code>

출력:

[[ nan  0.2  nan]
 [ nan  nan  0.5]
 [ nan  0.2  0.5]
 [ 0.1  0.2  nan]
 [ 0.1  0.2  0.5]
 [ 0.1  nan  0.5]
 [ 0.1  nan  nan]]

데이터 유형 보존

결과 배열, DataFrame.to_records()를 사용하여 NumPy 구조 배열을 만듭니다:

<code class="python">import numpy as np
import pandas as pd

structured_array = df.to_records()

print(structured_array)</code>

출력:

rec.array([('a', 1, 4, 7), ('b', 2, 5, 8), ('c', 3, 6, 9)],
          dtype=[('ID', 'O'), ('A', '<i8'), ('B', '<i8'), ('B', '<i8')])

위 내용은 누락된 값이 있는 Pandas DataFrame을 NaN을 유지하는 NumPy 배열로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.