>일반적인 문제 >데이터 마이닝의 6단계는 무엇입니까?

데이터 마이닝의 6단계는 무엇입니까?

Guanhui
Guanhui원래의
2020-07-27 13:49:5815047검색

데이터 마이닝의 6단계는 무엇입니까?

데이터 마이닝의 6단계는 무엇인가요?

데이터 마이닝은 대량의 데이터에서 효과적이고 새롭고 잠재적으로 유용하며 궁극적으로 이해할 수 있는 패턴을 얻는 중요한 프로세스입니다.

  • 1. 문제를 정의합니다. 데이터를 준비합니다.

  • 4. 모델을 찾아보고 확인합니다.

  • 데이터 마이닝에는 일반적으로 데이터 수집, 데이터 통합, 데이터 사양, 데이터 정리, 데이터 변환, 데이터 마이닝 구현 프로세스, 패턴 평가 및 지식 표현이 필요합니다.

  • 1. 데이터 수집: 획득한 데이터를 기반으로 데이터의 특성을 추상화합니다. 데이터 정보를 수집하고 수집된 정보를 데이터베이스에 저장합니다. 데이터 저장 및 관리에 적합한 데이터 웨어하우스 유형 선택
  • 2. 데이터 통합: 다양한 소스 및 형식의 데이터 분류

  • 3. 데이터 감소: 데이터의 양과 데이터의 가치가 상대적으로 클 때 사용할 수 있습니다. (데이터 값 - 데이터 평균) / 데이터 분산과 같은 데이터 세트의 축소 표현을 얻기 위한 축소 기술입니다. 이는 데이터가 훨씬 작아지지만 축소 후 데이터 마이닝의 결과에 가깝다는 것을 의미합니다. 결과는 기본적으로 동일합니다.
  • 4. 데이터 정리: 일부 데이터는 누락된 값(값이 존재하지 않음)이 있고 일부에는 노이즈(오류, 고립된 지점)가 포함되어 있고 일부는 일관성이 없습니다(예: 다른 단위, 등), 데이터 정리를 수행하는 도구를 사용하여 완전하고 정확하며 일관된 데이터를 얻을 수 있습니다.

  • 5. 데이터 변환: 데이터를 원활한 집계, 데이터 일반화, 표준화 등을 통해 데이터 마이닝에 적합한 데이터 세트로 변환합니다.
  • 6. 특징 추출 또는 특징 선택: 특징 추출은 주로 컴퓨터 비전 및 이미지 처리에 사용됩니다. 일반적으로 사용되는 방법에는 과적합을 방지하고 PCA 등이 포함됩니다.

  • 7. 데이터 마이닝 프로세스: 데이터 웨어하우스의 데이터 정보를 분석하고, 적절한 데이터 마이닝 도구를 선택하고, 통계 방법을 적용하고, 해당 데이터 마이닝 알고리즘을 사용합니다. .

8. 비즈니스 관점에서 데이터 분석 및 데이터 마이닝 결과의 정확성을 검증합니다.

9. 지식 표현, 데이터 마이닝 결과를 시각적인 방식으로 사용자에게 제시합니다.

추천 튜토리얼: "

PHP

"

위 내용은 데이터 마이닝의 6단계는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.