Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Zehn GitHub-Repositorys für AutoML

Zehn GitHub-Repositorys für AutoML

王林
王林nach vorne
2023-04-12 11:43:091752Durchsuche

Durchbrüche in der künstlichen Intelligenz und im maschinellen Lernen sind zwei der spannendsten Themen der letzten zwei Jahrzehnte. Ingenieure für maschinelles Lernen und Datenwissenschaft benötigen umfangreiche Forschung und harte Arbeit, um ihre Modelle effektiv zu verstehen und auszuführen.

Zehn GitHub-Repositorys für AutoML

Obwohl sie von Person zu Person unterschiedlich sein können, umfassen die Schritte des traditionellen maschinellen Lernens:

  1. Datenerfassung
  2. Datenexploration
  3. Datenvorbereitung
  4. Feature Engineering
  5. Auswahl
  6. Modelltraining
  7. Hyperparameter. T schwächelnd
  8. Vorhersagen

Während 8 Schritte beim Erstellen eines Modells für maschinelles Lernen vielleicht nicht viel zu sein scheinen, wird es einige Zeit dauern, mit den oben genannten Schritten zu beginnen, bis es perfekt ist!

Das Problem verschärft sich, wenn nicht erfahrene Praktiker des maschinellen Lernens diese Schritte zum ersten Mal durchführen; der Prozess erfordert oft mehr Zeit und Ressourcen, und selbst dann ist das Endergebnis möglicherweise nicht wie erwartet.

AutoML ist praktisch, da es einen Großteil des Modellerstellungsprozesses sowohl für Experten als auch für Nicht-Experten automatisiert.

Was ist automatisches maschinelles Lernen (AutoML)?

Automatisiertes maschinelles Lernen, oft auch AutoML genannt, erleichtert maschinelles Lernen. AutoML macht maschinelles Lernen für Nicht-Maschinenlern-Experten zugänglicher, indem es die automatisierte Verarbeitung durch ein bestimmtes Framework nutzt.

Der Schwerpunkt liegt auf der Beschleunigung der Forschung im Bereich der künstlichen Intelligenz und der Verbesserung der Effizienz von Modellen für maschinelles Lernen.

Der traditionelle maschinelle Lernprozess konzentriert sich auf alle 8 zuvor genannten Schritte, während AutoML zwei Schritte abdeckt:

  1. Datenerfassung ist der Prozess des Sammelns, Filterns und Bereinigens der verwendeten Daten vor der Speicherung im Data Warehouse.
  2. Vorhersage bezieht sich auf die tatsächliche Ausgabe, die von einem bestimmten Modell zurückgegeben wird. Ein trainiertes Modell wird wahrscheinlich eine genaue endgültige Vorhersage zurückgeben.

Der Rahmen aus Datenexploration, Datenvorbereitung, Feature-Engineering, Modellauswahl, Modelltraining und abschließender Modellabstimmung deckt die anderen 6 Schritte ab. Vorteile von AutoML Stellen Sie die 10 besten AutoML-Frameworks vor, wo Sie sie finden und welche Funktionen sie bieten.

1. Google AutoML

  • Google AutoML
  • ist eines der bekanntesten verfügbaren Frameworks und steht an erster Stelle in unserer Liste. Google hat viele AutoML-Frameworks eingeführt, wie z. B. Google AutoML Vision, Google AutoML Natural Language usw.
  • 2. Automatisches SKLearn
  • Benutzer, die bereits mit maschinellem Lernen vertraut waren, kennen möglicherweise den Namen SKlearn. Als Add-on zur beliebten „Sci-Kit-Learn-Bibliothek“ ist Auto SKLearn ein Open-Source-Framework für maschinelles Lernen, das die Automatisierung maschineller Lernaufgaben übernimmt.
  • Das Auto Sklearn-Framework ist in der Lage, seine Modellauswahl, Hyperparameter-Abstimmung und Charakterisierung durchzuführen, was eine einzigartige Funktion des Auto SKlearn-Frameworks darstellt.

Durch die Modellauswahl sucht Auto SKlearn automatisch nach dem besten Algorithmus, der das vom Benutzer angegebene Problem lösen kann.

Kommen wir zur zweiten Funktion von Auto SKlearn: Wir haben die Optimierung der Hyperparameter. Als einer der letzten Schritte für jedes maschinelle oder Deep-Learning-Modell sollten Benutzer die besten Modellparameter finden, um die Ergebnisse zu optimieren. Diese Aufgabe erfordert viel Zeit und kann durch solche Frameworks leicht automatisiert werden.

Der einzigartige und ultimative Vorteil der Verwendung von Auto SKlearn ist die Fähigkeit, eine automatische Charakterisierung durchzuführen.

Repräsentation

ist der Prozess der Umwandlung von Rohdaten in nutzbare Informationen. 3.TPot

TPOT

, auch bekannt als Tree Pipeline Optimization Tool, ist eines der frühesten Python-Open-Source-AutoML-Softwarepakete. Der Schwerpunkt liegt auf der Optimierung von Pipelines für maschinelles Lernen mithilfe genetischer Programmierung. Das Hauptziel von TPOT besteht darin, automatisch ML-Pipelines zu erstellen, indem flexible Ausdrucksbaumdarstellungen von Pipelines mit stochastischen Suchalgorithmen wie der genetischen Programmierung kombiniert werden.

Bitte beachten Sie, dass TPOT auf der

sci-kit-learn-Bibliothek

basiert, die zuerst installiert werden muss.

4.AutoKeras

AutoKeras ist eine Open-Source-Bibliothek für AutoML und Deep-Learning-Modelle, die ursprünglich von DATA Labs entwickelt wurde.

Auto Keras hilft Laien, Maschinen- und Deep-Learning-Enthusiasten, ihre Modelle mit minimalem Aufwand auszuführen und zu trainieren. Auto Keras zielt darauf ab, maschinelles Lernen für jedermann zugänglich zu machen und ist ein großartiges Werkzeug für Anfänger

5. Ludwig

Ludwig ist ein Open-Source-AutoML-Framework, das sich hauptsächlich auf die Zusammenstellung und das Training von Deep-Learning-Modellen mithilfe eines einfachen Konfigurationsdateisystems konzentriert.

Indem der Benutzer eine Konfigurationsdatei bereitstellen kann, die die Ein- und Ausgaben eines bestimmten Modells und ihre jeweiligen Datentypen definiert, nutzt das Ludwig-Framework diese Daten, um sein Deep-Learning-Modell basierend auf den zuvor genannten Eigenschaften zu erstellen.

6. MLBOX

MLBOX ist auf dem Vormarsch und entwickelt sich schnell zu einem der führenden Framework-Tools für automatisiertes maschinelles Lernen.

Laut der offiziellen MLBOX-Dokumentation bietet es die folgenden Vorteile:

  • Schnelles Lesen und verteilte Datenvorverarbeitung/-bereinigung/-formatierung.
  • Sehr robuste Funktionsauswahl und Leckerkennung.
  • Präzise Hyperparameteroptimierung im hochdimensionalen Raum.
  • Modernste Klassifizierungs- und Regressionsvorhersagemodelle (Deep Learning, Stacking, LightGBM usw.).
  • Verwenden Sie Modellerklärungen, um Vorhersagen zu treffen. AutoGloun
Laut der

AutoGloun-Onlinedokumentation

ermöglicht AutoGLoun Benutzern:

Mit nur wenigen Codezeilen schnell Prototypen für Deep Learning und klassische ML-Lösungen für Rohdaten erstellen.

Automatische Nutzung modernster Technologie (wo angemessen) ohne Fachwissen. Nutzen Sie die automatische Optimierung von Hyperparametern, Modellauswahl/-integration, Architektursuche und Datenverarbeitung.

    Verbessern/optimieren Sie benutzerdefinierte Modelle und Datenpipelines ganz einfach oder passen Sie AutoGluon für bestimmte Anwendungsfälle an.
  • 8. Microsoft Neural Network Intelligence (NNI)
  • Microsoft Neural Network Intelligence
  • , auch bekannt als NNI, ist ein Toolkit zur Automatisierung von Feature-Engineering, neuronaler Architektursuche, Hyperparameter-Tuning und Modellkomprimierung für Deep Learning.
NNI-Tool unterstützt PyTorch, TensorFlow, Scikit-learn, XGBoost, LightGBM und andere Frameworks. Der Hauptvorteil der Verwendung von Microsoft Neural Network ist die Suche nach neuronalen Architekturen. NNI-Tools unterstützen die Suche nach neuronalen Architekturen mit mehreren Spuren (Gittersuche, regulierte Evolution, richtlinienbasiertes IRL usw.) und One-Shot (DARTS, ENAS FBNet usw.). .

Dieses Tool bietet eine Vielzahl von Hyperparameter-Tuning-Algorithmen, wie z. B. Bayes'sche Optimierung, umfassende Suche und heuristische Suche. Schauen Sie sich die

Readme-Datei von NNI auf Github an, um mehr darüber zu erfahren, was dieses Tool sonst noch zu bieten hat.

9. TransmogrifAI

TransmogrifAI soll Entwicklern dabei helfen, die Produktivität des maschinellen Lernens zu steigern. TransmogrifAI läuft auf Apache Spark.

Wie in der Github-Readme-Datei zu Transmogrif kurz erwähnt:

„Mit der Automatisierung kann eine Genauigkeit erreicht werden, die der manuellen Optimierung des Modells nahekommt, und das in fast 100-mal kürzerer Zeit.“

Das Gleiche gilt für die anderen erwähnten AutoML-Frameworks. Ebenso die TransmogrifAI Das Tool ist in der Lage, den besten Algorithmus für einen vom Benutzer ausgewählten Datensatz auszuwählen.

10. H2O Automatic Machine Learning

H2O autoML

ist ein von H2O entwickeltes Open-Source-Framework-Tool, das sowohl R- als auch Python-Programmierung unterstützt.

Es unterstützt auch die am häufigsten verwendeten statistischen und maschinellen Lernalgorithmen, einschließlich Gradientenverstärkungsmaschinen, verallgemeinerte lineare Modelle und Deep Learning.

Die H2O-AutoML-Schnittstelle kommt neuen Benutzern des maschinellen Lernens entgegen, indem sie so wenige Parameter wie möglich erfordert. Die Hauptaufgabe des Benutzers bei der Verwendung des H2O-Tools besteht in der Bereitstellung des Datensatzes.

Andere nützliche AutoML-Tools

1. Hypertunity

Hypertunity

ist ein leichtgewichtiges Werkzeug, das entwickelt wurde, um einen bestimmten Hyperparameter eines Modells mithilfe eines leichtgewichtigen Pakets zu optimieren. Sie sind modular, einfach und erweiterbar, um eine nahtlose Planungsimplementierung zu ermöglichen.

Hypertunity unterstützt die Bayes'sche Optimierung mit GPyOpt, Slurm-kompatiblen Schedulern und Echtzeitvisualisierung mit Tensorboard (über das HParams-Plugin).

2. Dragonfly

Dragonfly

ist ein Open-Source-AutoML-Tool, das für die skalierbare Bayes'sche Optimierung entwickelt wurde.

Bayesianische Optimierung wird verwendet, um sehr teure Black-Box-Funktionen über die normale Optimierung hinaus zu bewerten.

Dragonfly ermöglicht es neuen Benutzern, skalierbare Bayes'sche Optimierungsfehler mit minimalem Wissen zu lösen.

3. Ray Tune

ist unser zweites Hyperparameter-Optimierungstool und ein einheitliches Framework zur Skalierung von KI- und Python-Anwendungen.

Es ermöglicht eine einfache KI-Workload-Skalierung durch verteilte Datenverarbeitung, verteiltes Training, skalierbares Hyperparameter-Tuning, skalierbares Reinforcement Learning und skalierbare programmierbare Dienste.

4. Automatisches Graph-Lernen

Auto Graph Learning ist ein einzigartiges AutoML-Framework, das sich auf das maschinelle Lernen von Graph-Datensätzen konzentriert, ganz einfach und unkompliziert.

Sie verwenden Datensätze, um Datensätze für graphbasiertes maschinelles Lernen auf der Grundlage von Pytorch-Geometrien oder Datensätzen in der Deep Graph Library zu verwalten.

GitHub-Repository für automatisiertes maschinelles Lernen

Mit den Fortschritten im Bereich des maschinellen und tiefen Lernens ist der Bedarf an Experten für maschinelles Lernen erheblich gestiegen, ohne dass darauf reagiert wurde.

Hier kommt die Automatisierung mit Tools und Techniken des maschinellen Lernens ins Spiel, die es neuen Benutzern ermöglicht, einfacher als je zuvor voll funktionsfähige und hochoptimierte Modelle zu erstellen.

Kurz gesagt: Wenn Sie nach dem perfekten Tool für automatisiertes maschinelles Lernen suchen, sollten Sie sich darauf konzentrieren, was Sie mit einem bestimmten Modell erreichen möchten und welchen Teil des maschinellen Lernprozesses Sie genau automatisieren möchten. Wir empfehlen Ihnen, mehrere der oben genannten AutoML-Tools selbst auszuprobieren und nur diejenigen zu verwenden, die Sie für effizient und benutzerfreundlich halten.

Das obige ist der detaillierte Inhalt vonZehn GitHub-Repositorys für AutoML. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen