Heim >Technologie-Peripheriegeräte >KI >Erste Schritte mit Kausaler KI in Python - Code Beispiele und ersten Schritte
Viele Branchenexperten in Frage stellen die Zuverlässigkeit gemeinsamer Vorhersagealgorithmen bei datengesteuerten Entscheidungen. Falsche Korrelationen wie das zwischen Schokoladenkonsum und Nobelpreisträger unterstreichen die entscheidende Unterscheidung zwischen Korrelation und Kausalität. Während Korrelation besteht, bedeutet sie nicht automatisch eine kausale Beziehung. Das Verständnis der Ursachen und der Verwendung von Datenanalysen für beeindruckende Veränderungen ist für Unternehmen von entscheidender Bedeutung, wobei führende Unternehmen wie Microsoft und Amazon stark in die kausale KI investieren.
Dieses Tutorial führt grundlegende kausale KI -Konzepte mit der Dowhy -Bibliothek von Python ein. Während sich das maschinelle Standardlernen unterscheidet, ist ein grundlegendes Verständnis der Regressionsanalyse hilfreich. DataCamps Kurse "Einführung in die lineare Modellierung in Python" und "Machine Learning for Business" bieten einen relevanten Hintergrund.
Kausale AI -Grundlagen
kausale Inferenz erfordert einen anderen Ansatz als eine prädiktive Analytik. Nancy Cartwrights "Keine Ursachen, keine Ursachen" betont die Notwendigkeit von Annahmen über die kausale Struktur, um kausale Antworten zu erhalten. Ein rein datengetriebener Ansatz ist unzureichend. Um die Kausalität zu bestimmen, müssen alternative Erklärungen ausgeschlossen werden, was externes Wissen über die Daten selbst hinaus erfordert.
Berücksichtigen Sie eine neue Auswirkungen der Mitarbeiterproduktivität der Mitarbeiter-Richtlinie (WFH). Die Erstanalyse könnte für WFH -Mitarbeiter einen höheren Abschluss der Aufgaben zeigen, aber ist das kausale? Andere Faktoren, wie Mitarbeiterpersönlichkeit oder Familiensituationen, könnten sowohl die WFH -Präferenz als auch die Produktivität beeinflussen, die als gemeinsame Ursachen wirken.
Hinweis: Graph, das durch causalfusion.net
erstellt wurdekausale Diagramme repräsentieren diese Beziehungen visuell, machen Annahmen explizit und ermöglichen eine Verfeinerung. Diese Annahmen können stark sein, aber die explizite Natur der kausalen Graphen verbessert die Glaubwürdigkeit der Analyse.
Dowhy in Python
Die Dowhy -Bibliothek von Microsoft (Teil des Pyhy -Ökosystems) ist ein führendes Instrument für die kausale Analyse in Python. Wir werden Daten simulieren, um kausale Inferenzschritte zu veranschaulichen.
!pip install git+https://github.com/microsoft/dowhy.git import numpy as np import pandas as pd import dowhy from dowhy import CausalModel import dowhy.datasets import statsmodels.api as sm # Set seed for reproducibility np.random.seed(1) # Simulate data data = dowhy.datasets.linear_dataset( beta=1, num_common_causes=2, num_discrete_common_causes=1, num_instruments=1, num_samples=10000, treatment_is_binary=True) df = data['df'] # ... (rest of the DoWhy code remains the same) ...Dowhy verwendet Etiketten, wie in Tabelle 1 gezeigt (die ursprüngliche Tabelle bleibt unverändert). Das Kausalgabel wird implizit durch Datenparameter definiert. Dowhy verwendet die Punktsprache, um Diagramme darzustellen.
digraph {v0->y;W0-> v0; W1-> v0;Z0-> v0;W0-> y; W1-> y;}Ein kausales Modell wird erstellt, das Daten kombiniert und Grafik:
model=CausalModel( data = df, treatment=data['treatment_name'], outcome=data['outcome_name'], graph=data['gml_graph'] )
Kausalanalyse und Vorspannungsreduktion
Eine einfache lineare Regression zeigt einen Steigungskoeffizienten, dies kann jedoch aufgrund häufiger Ursachen verzerrt werden. Das Backdoor -Kriterium von Dowhy hilft dabei, Variablen zu kontrollieren, die sowohl die Behandlung als auch das Ergebnis beeinflussen (Introversion und Anzahl der Kinder in diesem Beispiel).!pip install git+https://github.com/microsoft/dowhy.git import numpy as np import pandas as pd import dowhy from dowhy import CausalModel import dowhy.datasets import statsmodels.api as sm # Set seed for reproducibility np.random.seed(1) # Simulate data data = dowhy.datasets.linear_dataset( beta=1, num_common_causes=2, num_discrete_common_causes=1, num_instruments=1, num_samples=10000, treatment_is_binary=True) df = data['df'] # ... (rest of the DoWhy code remains the same) ...
dowhy liefert verschiedene Schätzmethoden; Die inverse Wahrscheinlichkeitsgewichtung wird hier für die Allgemeinheit verwendet. Die resultierende Schätzung liegt nahe an der Grundwahrheit und zeigt eine Verzerrungspflicht.
Stresstest und Robustheit
Die Refutationstests vonDowhy tragen zur Bewertung der Zuverlässigkeit der Annahme bei. Das Hinzufügen einer nicht beobachteten gemeinsamen Ursache beeinflusst den Bereich der Schätzung erheblich und zeigt den Einfluss nicht beobachtbarer Variablen.
Instrumentelle Variablen
instrumentelle Variablen (wie ein U -Bahn -Verschluss, der WFH betrifft, aber nicht direkt die Produktivität auswirkt) bieten eine alternative Identifikationsstrategie. Dowhy identifiziert automatisch geeignete Instrumente und liefert robuster, wenn auch möglicherweise weniger präzise, Schätzungen.
Schlussfolgerung
dowhy vereinfacht die kausale KI und bietet eine umfassende Pipeline. Erforschen Sie nach dem Beherrschen der Grundlagen fortschrittliche Techniken und andere Bibliotheken. Kausale Inferenz erfordert Domain -Expertise und Zusammenarbeit, um geeignete Modelle und Annahmen zu definieren. Es lohnt sich, kausale Antworten für fundierte Geschäftsentscheidungen von entscheidender Bedeutung zu erhalten. Der Kurs "Maschinelles Learning for Business" von DataCamp bietet weitere Lernmöglichkeiten.
Das obige ist der detaillierte Inhalt vonErste Schritte mit Kausaler KI in Python - Code Beispiele und ersten Schritte. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!