Maison >Problème commun >Quelle est la différence entre l'exploration de données et l'analyse de données ?
Différence : 1. La conclusion tirée par « l'analyse des données » est le résultat des activités intellectuelles humaines, tandis que la conclusion tirée par « l'exploration de données » est la connaissance découverte par la machine à partir de l'ensemble d'apprentissage [ou ensemble d'entraînement , ensemble d'échantillons] Règles ; 2. "L'analyse des données" ne peut pas établir de modèle mathématique et nécessite une modélisation manuelle, tandis que "l'exploration de données" complète directement la modélisation mathématique.
L'environnement d'exploitation de cet article : système Windows 7, ordinateur Dell G3.
Quelle est la différence entre le data mining et l'analyse de données ?
L'exploration de données consiste à trouver des règles cachées à partir de données massives. L'analyse des données a généralement un objectif clair.
La principale différence entre l'exploration de données et l'analyse de données
1 L'objectif de « l'analyse de données » est d'observer les données, tandis que l'objectif de « l'exploration de données » est. découvrir à partir des données "Knowledge Rules" KDD (Knowledge Discover in Database).
2. Les conclusions tirées par « l'analyse des données » sont les résultats des activités intellectuelles humaines, tandis que les conclusions tirées par le « data mining » sont les règles de connaissances découvertes par la machine à partir de l'ensemble d'apprentissage (ou ensemble d'entraînement, ensemble d'échantillons).
3. L'application de « l'analyse des données » pour tirer des conclusions est une activité intellectuelle humaine, tandis que les règles de connaissance découvertes par le « data mining » peuvent être directement appliquées aux prédictions.
4. "L'analyse des données" ne peut pas établir de modèle mathématique et nécessite une modélisation manuelle, tandis que le "data mining" complète directement la modélisation mathématique. Par exemple, l'essence de la modélisation cybernétique traditionnelle est de décrire la relation fonctionnelle entre les variables d'entrée et les variables de sortie.Le « data mining » peut établir automatiquement la relation fonctionnelle entre l'entrée et la sortie grâce à l'apprentissage automatique selon les « règles » dérivées de KDD. donné Un ensemble de paramètres d'entrée peut produire un ensemble de quantités de sortie.
Un exemple simple :
Il y a certaines personnes qui ne paient toujours pas à temps les opérateurs télécoms. Comment les détecter ?
Analyse des données : grâce à l'observation des données, nous avons constaté que 82 % des personnes qui ne paient pas à temps sont pauvres. La conclusion est donc que les personnes à faible revenu ont tendance à payer en retard. La conclusion est que les tarifs doivent être réduits.
Data mining : découvrez par vous-même les raisons profondes grâce à des algorithmes écrits. La raison peut être que les personnes qui vivent en dehors du cinquième périphérique ne paient pas à temps en raison de l'éloignement de l'environnement. La conclusion est qu’il faut créer davantage de halls d’affaires ou de points de paiement libre-service.
Pour plus d'articles connexes, veuillez visiter le Site Web PHP chinois ! !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!