搜索

首页  >  问答  >  正文

python - 对大面积空值的数据预处理是怎么进行的?

对于缺失值基本有删除、填充和重构变量等做法,但是具体的操作是怎么进行的呢?比方说你当你并不清楚各个字段的含义时:

1.如何认定该字段与模型无关、缺失值的比例达到多少就可以删除?

2.什么时候会认为缺失值也是一种有用的状态?

3.什么时候需要进行数据填充?

迷茫迷茫2747 天前672

全部回复(2)我来回复

  • 淡淡烟草味

    淡淡烟草味2017-05-18 10:54:09

    方法还是挺多的。
    我找到几个链接,附在下面,应该对你有帮助。

    训练集中有的特征含有缺失值,一般怎么处理
    如何判断缺失值是否是随机的缺失?

    回复
    0
  • 世界只因有你

    世界只因有你2017-05-18 10:54:09

    请问怎么用。

    回复
    0
  • 取消回复