Heim >häufiges Problem >Assoziationsregel-Mining
Assoziationsregeln sind Implikationen in Form von ). Unter ihnen genießt die Verbandsregel XY Unterstützung und Vertrauen.
Der Assoziationsregel-Mining-Prozess umfasst hauptsächlich zwei Phasen: In der ersten Phase müssen zunächst alle hochfrequenten Artikelgruppen (Frequent Itemsets) aus der Datenerfassung gefunden werden In der zweiten Stufe werden aus diesen hochfrequenten Projektgruppen Assoziationsregeln (Assoziationsregeln) generiert. (Empfohlenes Lernen: PHP-Video-Tutorial)
Die erste Stufe des Assoziationsregel-Minings muss alle hochfrequenten Artikelgruppen (große Artikelmengen) aus der ursprünglichen Datensammlung finden.
Hohe Häufigkeit bedeutet, dass die Häufigkeit einer bestimmten Artikelgruppe im Verhältnis zu allen Datensätzen ein bestimmtes Niveau erreichen muss. Die Häufigkeit des Auftretens einer Elementgruppe wird als Unterstützung bezeichnet. Nehmen wir als Beispiel ein 2-Element-Set, das zwei Elemente A und B enthält, können wir die Unterstützung der Elementgruppe, die {A, B} enthält, durch Formel (1) erhalten, wenn die Wenn die Unterstützung größer oder gleich dem festgelegten Mindestunterstützungsschwellenwert ist, wird {A, B} als hochfrequente Artikelgruppe bezeichnet.
Ein k-Itemset, das die Mindestunterstützung erfüllt, wird als Hochfrequenz-k-Itemset (häufiges k-Itemset) bezeichnet und im Allgemeinen als großes k oder häufiges k ausgedrückt. Der Algorithmus generiert dann Large k+1 aus der Large k-Elementgruppe, bis keine hochfrequente Elementgruppe mehr gefunden werden kann.
Die zweite Stufe des Assoziationsregel-Minings besteht darin, Assoziationsregeln (Assoziationsregeln) zu generieren. Beim Generieren von Assoziationsregeln aus hochfrequenten Elementgruppen werden im vorherigen Schritt die hochfrequenten k-Elementgruppen zum Generieren von Regeln verwendet. Unter dem bedingten Schwellenwert der Mindestkonfidenz (Minimalkonfidenz), wenn die durch eine Regel erhaltene Konfidenz das Minimum erfüllt Vertrauen Diese Regel wird als Assoziationsregel bezeichnet.
Zum Beispiel: Die Zuverlässigkeit der von der Hochfrequenz-K-Item-Gruppe {A, B} erzeugten Regel AB kann durch Formel (2) ermittelt werden, wenn die Zuverlässigkeit größer oder gleich dem Minimum ist Zuverlässigkeit, sie wird AB für Assoziationsregeln genannt.
Basierend auf den Kategorien der in den Regeln verarbeiteten Variablen
Variablen, die durch Assoziationsregeln verarbeitet werden, können in boolesche und numerische Typen unterteilt werden. Die durch boolesche Assoziationsregeln verarbeiteten Werte sind diskret und kategorisch und zeigen die Beziehung zwischen diesen Variablen, während numerische Assoziationsregeln mit mehrdimensionalen Assoziations- oder mehrschichtigen Assoziationsregeln kombiniert werden können, um numerische Felder dynamisch zu verarbeiten. oder die Originaldaten direkt verarbeiten. Natürlich können numerische Assoziationsregeln auch Kategorievariablen umfassen. Beispiel: Geschlecht = „Weiblich“ => Beruf = „Sekretärin“, was eine boolesche Assoziationsregel ist. Geschlecht = „Weiblich“ => Durchschnitt (Einkommen) = 2300, das betroffene Einkommen ist ein numerischer Typ, es handelt sich also um eine Zahl Verbandsregel.
Basierend auf der Abstraktionsebene der Daten in den Regeln
Basierend auf der Abstraktionsebene der Daten in den Regeln kann sie in einschichtige Assoziationen unterteilt werden Regeln und mehrschichtige Assoziationsregeln. Bei einstufigen Assoziationsregeln berücksichtigen nicht alle Variablen, dass die tatsächlichen Daten mehrere unterschiedliche Ebenen haben. Bei mehrstufigen Assoziationsregeln wurde die mehrstufige Natur der Daten vollständig berücksichtigt. Beispiel: IBM-Desktop =>Sony-Drucker, ist eine einschichtige Zuordnungsregel für detaillierte Daten; Desktop =>Sony-Drucker, ist eine mehrschichtige Zuordnungsregel zwischen einer höheren Ebene und einer Detailebene.
Basierend auf der Dimensionalität der an der Regel beteiligten Daten
Die Daten in Assoziationsregeln können in eindimensionale und mehrdimensionale unterteilt werden. Bei eindimensionalen Assoziationsregeln beziehen wir nur eine Dimension der Daten ein, beispielsweise die vom Benutzer gekauften Artikel, während bei mehrdimensionalen Assoziationsregeln die zu verarbeitenden Daten mehrere Dimensionen umfassen. Mit anderen Worten: Eindimensionale Assoziationsregeln befassen sich mit einigen Beziehungen in einem einzelnen Attribut. Mehrdimensionale Assoziationsregeln befassen sich mit einigen Beziehungen zwischen verschiedenen Attributen. Beispiel: Bier => Windeln, diese Regel betrifft nur die vom Benutzer gekauften Artikel; Geschlecht = „Weiblich“ => Beruf = „Sekretärin“, diese Regel umfasst Informationen in zwei Feldern, die eine Assoziationsregel darstellen.
Weitere technische Artikel zum Thema PHP finden Sie in der Spalte PHP-Grafik-Tutorial, um mehr darüber zu erfahren!
Das obige ist der detaillierte Inhalt vonAssoziationsregel-Mining. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!