>  Q&A  >  본문

Python - 널 값이 있는 넓은 영역의 데이터를 전처리하는 방법은 무엇입니까?

결측값의 경우 기본적으로 변수 삭제, 채우기, 재구성 등의 방법이 있는데, 구체적인 연산은 어떻게 수행되나요? 예를 들어, 각 필드의 의미를 모르는 경우:

1. 필드가 모델과 아무 관련이 없는지 확인하는 방법과 삭제되기 전에 삭제할 수 있는 결측값의 비율은 어떻게 되나요?

2. 결측값은 언제 유용한 상태로 간주되나요?

3. 데이터 입력은 언제 필요합니까?

迷茫迷茫2712일 전647

모든 응답(2)나는 대답할 것이다

  • 淡淡烟草味

    淡淡烟草味2017-05-18 10:54:09

    아직 방법은 많습니다.
    아래에 첨부된 몇 가지 링크를 찾았는데 도움이 될 것입니다.

    훈련 세트의 일부 기능에는 누락된 값이 포함되어 있습니다. 이를 처리하는 방법은 무엇입니까?
    누락된 값이 무작위로 누락되었는지 확인하는 방법은 무엇입니까?

    회신하다
    0
  • 世界只因有你

    世界只因有你2017-05-18 10:54:09

    사용방법을 알려주세요.

    회신하다
    0
  • 취소회신하다