Heim >häufiges Problem >Was sind die sechs Schritte des Data Mining?

Was sind die sechs Schritte des Data Mining?

Guanhui
GuanhuiOriginal
2020-07-27 13:49:5815046Durchsuche

Was sind die sechs Schritte des Data Mining?

Was sind die sechs Schritte des Data Mining?

Data Mining ist der nicht triviale Prozess, um aus großen Datenmengen effektive, neuartige, potenziell nützliche und letztlich verständliche Muster zu gewinnen. Die Schritte sind:

  • 1. Definieren Sie das Problem

  • 2. Daten durchsuchen; >

    4. Generieren Sie das Modell;

  • 5. Stellen Sie das Modell bereit und aktualisieren Sie es.

  • Data Mining erfordert normalerweise Datenerfassung, Datenintegration, Datenspezifikation, Datenbereinigung, Datentransformation, Data Mining-Implementierungsprozess, Musterbewertung und Wissensdarstellung

  • 1 Sammlung: Abstrahieren Sie basierend auf den erhaltenen Daten die charakteristischen Informationen der Daten und speichern Sie die gesammelten Informationen in der Datenbank. Wählen Sie einen geeigneten Data-Warehouse-Typ für die Datenspeicherung und -verwaltung
  • 2. Datenintegration: Klassifizieren Sie Daten aus verschiedenen Quellen und Formaten

  • 3 Wenn der Datenwert relativ groß ist, können wir die Reduktionstechnologie verwenden, um die Reduktionsdarstellung des Datensatzes zu erhalten, z. B. (Datenwert - Datendurchschnitt) / Datenvarianz. Dies bedeutet, dass die Daten viel kleiner werden, aber der Integrität nahe kommen Die Originaldaten nach der Reduktion Die Ergebnisse des Data Mining stimmen im Wesentlichen mit den Ergebnissen vor der Spezifikation überein.
  • 4. Datenbereinigung: Einige Daten sind unvollständig, z. B.: Einige haben fehlende Werte (Werte existieren nicht), einige enthalten Rauschen (Fehler, isolierte Punkte) und einige sind inkonsistent (z als verschiedene Einheiten usw.), können wir Tools verwenden, um die Daten zu bereinigen und vollständige, korrekte und konsistente Daten zu erhalten.

  • 5. Datentransformation: Konvertieren Sie Daten in einen für Data Mining geeigneten Datensatz durch reibungslose Aggregation, Datenverallgemeinerung, Standardisierung usw.

6. Merkmalsextraktion oder Merkmalsauswahl: Die Merkmalsextraktion wird hauptsächlich in der Computer Vision und Bildverarbeitung verwendet, um irrelevante und redundante Merkmale vorzuschlagen, um eine Überanpassung zu verhindern und die Modellgenauigkeit zu verbessern und so weiter.

7. Data-Mining-Prozess: Analysieren Sie die Dateninformationen im Data Warehouse, wählen Sie geeignete Data-Mining-Tools aus, wenden Sie statistische Methoden an und verwenden Sie entsprechende Data-Mining-Algorithmen. .

8. Überprüfen Sie aus geschäftlicher Sicht die Richtigkeit der Ergebnisse der Datenanalyse und des Data Mining.

9. Wissensdarstellung, die den Benutzern die Ergebnisse des Data Mining visuell präsentiert.

Empfohlenes Tutorial: „

PHP

Das obige ist der detaillierte Inhalt vonWas sind die sechs Schritte des Data Mining?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn