Heim >Technologie-Peripheriegeräte >KI >Ein weiteres Artefakt zur Modellinterpretation für maschinelles Lernen: Shapash
Shapash funktioniert mit den meisten Sklearn-, Lightgbm-, Xgboost- und Catboost-Modellen und kann für Klassifizierungs- und Regressionsaufgaben verwendet werden. Es verwendet das Shap-Backend, um den lokalen Beitrag von Features zu berechnen. Dies kann jedoch durch eine andere Strategie zur Berechnung des lokalen Beitrags ersetzt werden. Datenwissenschaftler können den Shapash-Interpreter nutzen, um ihre Modelle zu untersuchen und Fehler zu beheben, oder ihn einsetzen, um Visualisierungen jeder Schlussfolgerung bereitzustellen. Und es können auch Webanwendungen erstellt werden, die Endkunden und Unternehmern einen enormen Mehrwert bieten können. ?? Die Unterschiede zwischen globalen und lokalen Nachbarschaften können mithilfe einer Webanwendung leicht erkundet werden, um deren Modell schnell zu verstehen und zu verstehen, wie sich verschiedene Schlüsselpunkte auswirken:
shapash-Bibliotheks-Webapp
3. Zusammenfassung und Exporterklärung
Der vollständige Datenbericht kann hier eingesehen werden: https://shapash-demo.ossbymaif.fr/
Einige Funktionen von Shapash sind wie folgt:
1. Modell für maschinelles Lernen: Es eignet sich für Klassifizierungs- (Binär- oder Mehrklassenprobleme) und Regressionsprobleme. Es unterstützt mehrere Modelle wie Catboost, Xgboost, LightGBM, Sklearn Ensemble, lineare Modelle und SVM.
2. Merkmalskodierung: Es unterstützt eine große Anzahl von Kodierungstechniken zur Verarbeitung kategorialer Merkmale in unserem Datensatz, wie z. B. One-Hot-Kodierung, Ordinalkodierung, Base-N-Kodierung, Zielkodierung oder Binärkodierung usw. 3.SklearnColumnTransformer: OneHotEncoder, OrdinalEncoder, StandardScaler, QuantileTransformer oder PowerTransformer 4.Visualisierung: Bietet eine Reihe visueller Effekte, um Ihre Ergebnisse einfach zu erklären und verständliche und klare Ergebnisse anzuzeigen. 5. Es ist kompatibel mit Lime und Shap. Es nutzt das Shap-Backend, um Ergebnisse in nur wenigen Codezeilen anzuzeigen.6. Es bietet viele Optionen für Parameter, um präzise Ergebnisse zu erhalten.
8. Bereitstellung: Untersuchung und Bereitstellung (über API oder Batch-Modus) für den betrieblichen Einsatz sind wichtig. Erstellen Sie ganz einfach Webanwendungen, um von global nach lokal zu navigieren.
So funktioniert Shapash
Sie können Shapash mit dem folgenden Code installieren:
<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">pip</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">install</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">shapash</span>
Für Jupyter Notebook: Wenn Sie Jupyter Notebook verwenden und Um das Inline-Diagramm anzuzeigen, müssen Sie einen anderen Befehl verwenden:
<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">pip</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">install</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">ipywidgets</span>
Hier werden wir Shapash mithilfe des Datensatzes zur Hauspreisvorhersage untersuchen. Dies ist ein Regressionsproblem und wir müssen die Immobilienpreise vorhersagen. Zuerst analysieren wir den Datensatz, einschließlich univariater und bivariater Analysen, dann modellieren wir die Interpretierbarkeit mithilfe von Merkmalsbedeutung, Merkmalsbeitrag, lokalen Diagrammen und Vergleichsdiagrammen, dann modellieren wir die Leistung und schließlich WebApp.
Univariate Analyse
Verwenden Sie das Bild unten, um den Namen First Floor Square Elements von zu verstehen Füße. Wir können eine Tabelle sehen, die verschiedene Statistiken für unsere Trainings- und Testdatensätze anzeigt, z. B. Mittelwert, Maximum, Minimum, Standardabweichung, Median und mehr. In der Abbildung rechts sehen Sie die Verteilungsdiagramme der Trainings- und Testdatensätze. Shapash erwähnt auch, ob unsere Funktionen kategorisch oder numerisch sind, und bietet außerdem eine Dropdown-Option, in der alle Funktionen verfügbar sind.
Univariate Analyse
Für kategoriale Funktionen zeigen die Trainings- und Testdatensätze nicht doppelte und fehlende Werte. Auf der rechten Seite wird ein Balkendiagramm angezeigt, das den Prozentsatz der entsprechenden Kategorie in jeder Funktion zeigt.
Kategorien in Funktionen
Zielanalyse
Sie können Sie auch eine detaillierte Analyse der Zielvariablen namens „Verkaufspreis“ sehen. Auf der linken Seite werden alle Statistiken wie Anzahl, Mittelwert, Standardabweichung, Minimum, Maximum, Median usw. für Trainings- und Vorhersagedatensätze angezeigt. Rechts werden die Verteilungen der Trainings- und Vorhersagedatensätze angezeigt.
Objektive Analyse
Analyse mehrerer Variablen
oben Wir diskutieren univariate Analysen im Detail. In diesem Abschnitt werden wir uns mit der multivariaten Analyse befassen. Die folgende Abbildung zeigt die Korrelationsmatrix für die ersten 20 Features der Trainings- und Testdatensätze. Die Korrelationsskala wird auch anhand verschiedener Farben dargestellt. Auf diese Weise verwenden wir Shapash, um Beziehungen zwischen Features zu visualisieren. #? #
Durch die Verwendung dieser Bibliothek können wir die Bedeutung dieser Funktion erkennen. Die Merkmalswichtigkeit ist eine Methode zum Ermitteln der Bedeutung von Eingabemerkmalen bei der Vorhersage von Ausgabewerten. Die folgende Abbildung zeigt die Feature-Wichtigkeitskurve:
Feature-Beitragsdiagramm#🎜 🎜 #
Diese Kurven helfen uns bei der Beantwortung von Fragen, z. B. wie sich eine Funktion auf meine Vorhersagen auswirkt, ob ihr Beitrag positiv oder negativ ist usw. Dieses Diagramm verdeutlicht die Bedeutung der Interpretierbarkeit des Modells. Die Gesamtkonsistenz des Modells macht es wahrscheinlicher, die Auswirkungen von Features auf das Modell zu verstehen. Wir können die Beitragsdiagramme numerischer und kategorialer Merkmale sehen. Für numerische MerkmaleBeitragstabelle # 🎜🎜#Für Klassifizierungsmerkmale
Für KlassifizierungsmerkmaleTeilbild#🎜 🎜 #Wir können Teildiagramme zeichnen. Das Bild unten zeigt ein Teilbild:
Teildiagramm
Vergleichsdiagramm
Wir können Vergleichsdiagramme zeichnen. Das Bild unten zeigt das Vergleichsdiagramm:
Vergleichsdiagramm
Nach der Datenanalyse trainieren wir das Modell für maschinelles Lernen. Das Bild unten zeigt die Ausgabe unserer Vorhersage. Auf der linken Seite werden Statistiken wie Anzahl, Minimum, Maximum, Median, Standardabweichung usw. für die wahren und vorhergesagten Werte angezeigt. Rechts ist die Verteilung der vorhergesagten und tatsächlichen Werte dargestellt.
Modellleistung
Nach dem Modelltraining können wir auch eine WebApp erstellen. Diese Web-App zeigt ein vollständiges Dashboard unserer Daten, einschließlich dessen, was wir bisher abgedeckt haben. Das Bild unten zeigt das Dashboard.
WebApp
Projektadresse: https://github.com/MAIF/shapash
Dieser Artikel stellt kurz die Grundfunktionen und die Zeichenanzeige von Shapash vor Python-Bibliothek Ein gewisses Verständnis.
Das obige ist der detaillierte Inhalt vonEin weiteres Artefakt zur Modellinterpretation für maschinelles Lernen: Shapash. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!