누락된 값이 있는 Pandas 데이터 프레임을 NumPy 배열로 변환하고 누락된 값을 유지합니다. np.nan으로. 다음 데이터 프레임을 고려하십시오.
<code class="python">index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan] c = [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan] df = pd.DataFrame({'A': a, 'B': b, 'C': c}, index=index) df = df.rename_axis('ID') print(df)</code>
출력:
A B C ID 1 NaN 0.2 NaN 2 NaN NaN 0.5 3 NaN 0.2 0.5 4 0.1 0.2 NaN 5 0.1 0.2 0.5 6 0.1 NaN 0.5 7 0.1 NaN NaN
to_numpy() 메서드를 사용하여 데이터 프레임을 np.nan으로 표현된 누락된 값이 있는 NumPy 배열:
<code class="python">import numpy as np import pandas as pd np_array = df.to_numpy() print(np_array)</code>
출력:
[[ nan 0.2 nan] [ nan nan 0.5] [ nan 0.2 0.5] [ 0.1 0.2 nan] [ 0.1 0.2 0.5] [ 0.1 nan 0.5] [ 0.1 nan nan]]
결과 배열, DataFrame.to_records()를 사용하여 NumPy 구조 배열을 만듭니다:
<code class="python">import numpy as np import pandas as pd structured_array = df.to_records() print(structured_array)</code>
출력:
rec.array([('a', 1, 4, 7), ('b', 2, 5, 8), ('c', 3, 6, 9)], dtype=[('ID', 'O'), ('A', '<i8'), ('B', '<i8'), ('B', '<i8')])
위 내용은 누락된 값이 있는 Pandas DataFrame을 NaN을 유지하는 NumPy 배열로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!