Maison >Problème commun >Exploration des règles d'association

Exploration des règles d'association

(*-*)浩
(*-*)浩original
2019-07-27 14:42:196385parcourir

Les règles d'association sont des implications sous la forme de ). Parmi elles, la règle d'association XY bénéficie du soutien et de la confiance.

Exploration des règles d'association

Le processus d'exploration des règles d'association comprend principalement deux étapes : la première étape doit d'abord trouver tous les groupes d'éléments à haute fréquence (Frequent Itemsets) de la collecte de données, dans la deuxième étape, des règles d'association (Association Rules) sont générées à partir de ces groupes de projets à haute fréquence. (Apprentissage recommandé : Tutoriel vidéo PHP)

La première étape de l'exploration de règles d'association doit trouver tous les groupes d'éléments à haute fréquence (grands ensembles d'éléments) de la collection de données d'origine.

Une fréquence élevée signifie que la fréquence d'apparition d'un certain groupe d'éléments par rapport à tous les enregistrements doit atteindre un certain niveau. La fréquence d'apparition d'un groupe d'éléments est appelée support. En prenant comme exemple un ensemble de 2 éléments contenant deux éléments A et B, nous pouvons obtenir le support du groupe d'éléments contenant {A, B} grâce à la formule (1) , si le le support est supérieur ou égal au seuil de support minimum défini, {A, B} est appelé un groupe d'articles à haute fréquence.

Un k-itemset qui satisfait au support minimum est appelé un k-itemset haute fréquence (Frequent k-itemset), généralement exprimé par Large k ou Frequent k. L'algorithme génère ensuite Large k+1 à partir du groupe d'éléments Large k jusqu'à ce qu'aucun groupe d'éléments à haute fréquence ne puisse être trouvé.

La deuxième étape de l'exploration des règles d'association consiste à générer des règles d'association (Association Rules). Générer des règles d'association à partir de groupes d'éléments à haute fréquence consiste à utiliser le groupe d'éléments à k haute fréquence de l'étape précédente pour générer des règles sous le seuil conditionnel de confiance minimale (Confiance minimale), si la confiance obtenue par une règle satisfait au minimum. confiance Cette règle est appelée règle d'association.

Par exemple : la fiabilité de la règle AB générée par le groupe d'éléments k haute fréquence {A, B} peut être obtenue par la formule (2) si la fiabilité est supérieure ou égale au minimum. fiabilité, on l'appelle AB pour règles d'association.

En fonction des catégories de variables traitées dans les règles

Les variables traitées par les règles d'association peuvent être divisées en types booléens et numériques. Les valeurs traitées par les règles d'association booléennes sont discrètes et catégoriques, et elles montrent la relation entre ces variables ; tandis que les règles d'association numérique peuvent être combinées avec des règles d'association multidimensionnelles ou multicouches pour traiter les champs numériques, ou traiter directement les données originales. Bien entendu, les règles d'association numérique peuvent également inclure des variables de catégorie. Par exemple : Gender = "Female" => Occupation = "Secrétaire", qui est une règle d'association booléenne ; Gender = "Female" => moy (revenu) = 2 300, le revenu concerné est de type numérique, il s'agit donc d'un numérique. règle d'association.

Basé sur le niveau d'abstraction des données dans les règles

Basé sur le niveau d'abstraction des données dans les règles, il peut être divisé en association monocouche règles et règles d'association multicouches. Dans les règles d'association à un seul niveau, toutes les variables ne tiennent pas compte du fait que les données réelles comportent plusieurs niveaux différents ; dans les règles d'association à plusieurs niveaux, la nature multi-niveaux des données a été pleinement prise en compte. Par exemple : IBM Desktop =>Sony Printer, est une règle d'association monocouche sur des données détaillées ; Desktop =>Sony Printer, est une règle d'association multicouche entre un niveau supérieur et un niveau de détail.

Basé sur la dimensionnalité des données impliquées dans la règle

Les données des règles d'association peuvent être divisées en unidimensionnelles et multidimensionnelles. Dans les règles d'association unidimensionnelles, nous n'impliquons qu'une seule dimension des données, comme les articles achetés par l'utilisateur ; dans les règles d'association multidimensionnelles, les données à traiter impliqueront plusieurs dimensions. En d’autres termes, les règles d’association unidimensionnelles traitent certaines relations au sein d’un seul attribut ; les règles d’association multidimensionnelles traitent certaines relations entre divers attributs. Par exemple : Bière => Couches, cette règle concerne uniquement les articles achetés par l'utilisateur ; Sexe = "Femme" => Occupation = "Secrétaire", cette règle implique des informations dans deux champs, qui sont deux dimensions sur lesquelles une règle d'association.

Pour plus d'articles techniques liés à PHP, veuillez visiter la colonne Tutoriel graphique PHP pour apprendre !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn