欠損値の場合、基本的には変数を削除する、埋める、再構築するなどの方法がありますが、具体的な操作はどのように行われるのでしょうか?たとえば、各フィールドの意味がわからない場合:
1. このフィールドがモデルと無関係であることを判断する方法と、欠損値のどの程度の割合を削除できるか?
2. 欠損値が有用なステータスとみなされるのはどのような場合ですか?
3. データの入力はどのような場合に必要ですか?
淡淡烟草味2017-05-18 10:54:09
まだまだ方法はたくさんあります。
以下にいくつかのリンクを添付しましたので、お役に立つと思います。
トレーニングセットの一部の特徴に欠損値が含まれています。それにどう対処しますか?
欠損値がランダムに欠損しているかどうかを判断するにはどうすればよいですか?