首頁  >  問答  >  主體

python - 大面積空值的資料預處理是怎麼進行的?

對於缺失值基本上有刪除、填充和重構變數等做法,但是具體的操作是怎麼進行的呢?比方說你當你不清楚各個欄位的意思時:

1.如何認定該欄位與模型無關、缺失值的比例達到多少就可以刪除?

2.什麼時候會認為缺失值也是一種有用的狀態?

3.什麼時候需要進行資料填充?

迷茫迷茫2712 天前648

全部回覆(2)我來回復

  • 淡淡烟草味

    淡淡烟草味2017-05-18 10:54:09

    方法還挺多的。
    我找到幾個鏈接,附在下面,應該對你有幫助。

    訓練集中有的特徵含有缺失值,一般怎麼處理
    如何判斷缺失值是否為隨機的缺失?

    回覆
    0
  • 世界只因有你

    世界只因有你2017-05-18 10:54:09

    請問怎麼用。

    回覆
    0
  • 取消回覆