ホームページ  >  記事  >  バックエンド開発  >  欠損値のある Pandas DataFrame を NaN を保持する NumPy 配列に変換する方法

欠損値のある Pandas DataFrame を NaN を保持する NumPy 配列に変換する方法

Patricia Arquette
Patricia Arquetteオリジナル
2024-11-05 02:27:02552ブラウズ

How to Convert a Pandas DataFrame with Missing Values to a NumPy Array Preserving NaN?

欠損値のある Pandas データフレームを NumPy 配列に変換する

問題

欠損値を保持したまま、欠損値のある Pandas データフレームを NumPy 配列に変換しますnp.nanとして。次のデータフレームを考えてみましょう:

<code class="python">index = [1, 2, 3, 4, 5, 6, 7]
a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1]
b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan]
c = [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan]
df = pd.DataFrame({'A': a, 'B': b, 'C': c}, index=index)
df = df.rename_axis('ID')

print(df)</code>

出力:

      A    B    C
ID
1   NaN  0.2  NaN
2   NaN  NaN  0.5
3   NaN  0.2  0.5
4   0.1  0.2  NaN
5   0.1  0.2  0.5
6   0.1  NaN  0.5
7   0.1  NaN  NaN

df.to_numpy() を使用した解決策

to_numpy() メソッドを使用して、データフレームをnp.nan:

<code class="python">import numpy as np
import pandas as pd

np_array = df.to_numpy()

print(np_array)</code>

出力:

[[ nan  0.2  nan]
 [ nan  nan  0.5]
 [ nan  0.2  0.5]
 [ 0.1  0.2  nan]
 [ 0.1  0.2  0.5]
 [ 0.1  nan  0.5]
 [ 0.1  nan  nan]]

データ型の保持

でデータ型を保持する必要がある場合は、np.nan として表される欠損値を持つ NumPy 配列結果の配列、DataFrame.to_records() を使用して NumPy 構造化配列を作成します:

<code class="python">import numpy as np
import pandas as pd

structured_array = df.to_records()

print(structured_array)</code>

出力:

rec.array([('a', 1, 4, 7), ('b', 2, 5, 8), ('c', 3, 6, 9)],
          dtype=[('ID', 'O'), ('A', '<i8'), ('B', '<i8'), ('B', '<i8')])

以上が欠損値のある Pandas DataFrame を NaN を保持する NumPy 配列に変換する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。