Heim > Artikel > Technologie-Peripheriegeräte > Zehn GitHub-Repositorys für AutoML
Durchbrüche in der künstlichen Intelligenz und im maschinellen Lernen sind zwei der spannendsten Themen der letzten zwei Jahrzehnte. Ingenieure für maschinelles Lernen und Datenwissenschaft benötigen umfangreiche Forschung und harte Arbeit, um ihre Modelle effektiv zu verstehen und auszuführen.
Obwohl sie von Person zu Person unterschiedlich sein können, umfassen die Schritte des traditionellen maschinellen Lernens:
Während 8 Schritte beim Erstellen eines Modells für maschinelles Lernen vielleicht nicht viel zu sein scheinen, wird es einige Zeit dauern, mit den oben genannten Schritten zu beginnen, bis es perfekt ist!
Das Problem verschärft sich, wenn nicht erfahrene Praktiker des maschinellen Lernens diese Schritte zum ersten Mal durchführen; der Prozess erfordert oft mehr Zeit und Ressourcen, und selbst dann ist das Endergebnis möglicherweise nicht wie erwartet.
AutoML ist praktisch, da es einen Großteil des Modellerstellungsprozesses sowohl für Experten als auch für Nicht-Experten automatisiert.
Automatisiertes maschinelles Lernen, oft auch AutoML genannt, erleichtert maschinelles Lernen. AutoML macht maschinelles Lernen für Nicht-Maschinenlern-Experten zugänglicher, indem es die automatisierte Verarbeitung durch ein bestimmtes Framework nutzt.
Der Schwerpunkt liegt auf der Beschleunigung der Forschung im Bereich der künstlichen Intelligenz und der Verbesserung der Effizienz von Modellen für maschinelles Lernen.
Der traditionelle maschinelle Lernprozess konzentriert sich auf alle 8 zuvor genannten Schritte, während AutoML zwei Schritte abdeckt:
Der Rahmen aus Datenexploration, Datenvorbereitung, Feature-Engineering, Modellauswahl, Modelltraining und abschließender Modellabstimmung deckt die anderen 6 Schritte ab. Vorteile von AutoML Stellen Sie die 10 besten AutoML-Frameworks vor, wo Sie sie finden und welche Funktionen sie bieten.
Kommen wir zur zweiten Funktion von Auto SKlearn: Wir haben die Optimierung der Hyperparameter. Als einer der letzten Schritte für jedes maschinelle oder Deep-Learning-Modell sollten Benutzer die besten Modellparameter finden, um die Ergebnisse zu optimieren. Diese Aufgabe erfordert viel Zeit und kann durch solche Frameworks leicht automatisiert werden.
ist der Prozess der Umwandlung von Rohdaten in nutzbare Informationen. 3.TPot
TPOT, auch bekannt als Tree Pipeline Optimization Tool, ist eines der frühesten Python-Open-Source-AutoML-Softwarepakete. Der Schwerpunkt liegt auf der Optimierung von Pipelines für maschinelles Lernen mithilfe genetischer Programmierung. Das Hauptziel von TPOT besteht darin, automatisch ML-Pipelines zu erstellen, indem flexible Ausdrucksbaumdarstellungen von Pipelines mit stochastischen Suchalgorithmen wie der genetischen Programmierung kombiniert werden.
Bitte beachten Sie, dass TPOT auf der
sci-kit-learn-Bibliothekbasiert, die zuerst installiert werden muss.
4.AutoKeras
AutoKeras ist eine Open-Source-Bibliothek für AutoML und Deep-Learning-Modelle, die ursprünglich von DATA Labs entwickelt wurde.
Ludwig ist ein Open-Source-AutoML-Framework, das sich hauptsächlich auf die Zusammenstellung und das Training von Deep-Learning-Modellen mithilfe eines einfachen Konfigurationsdateisystems konzentriert.
Indem der Benutzer eine Konfigurationsdatei bereitstellen kann, die die Ein- und Ausgaben eines bestimmten Modells und ihre jeweiligen Datentypen definiert, nutzt das Ludwig-Framework diese Daten, um sein Deep-Learning-Modell basierend auf den zuvor genannten Eigenschaften zu erstellen.
MLBOX ist auf dem Vormarsch und entwickelt sich schnell zu einem der führenden Framework-Tools für automatisiertes maschinelles Lernen.
Laut der offiziellen MLBOX-Dokumentation bietet es die folgenden Vorteile:
Mit nur wenigen Codezeilen schnell Prototypen für Deep Learning und klassische ML-Lösungen für Rohdaten erstellen.
Automatische Nutzung modernster Technologie (wo angemessen) ohne Fachwissen. Nutzen Sie die automatische Optimierung von Hyperparametern, Modellauswahl/-integration, Architektursuche und Datenverarbeitung.
Readme-Datei von NNI auf Github an, um mehr darüber zu erfahren, was dieses Tool sonst noch zu bieten hat.
9. TransmogrifAITransmogrifAI soll Entwicklern dabei helfen, die Produktivität des maschinellen Lernens zu steigern. TransmogrifAI läuft auf Apache Spark.
Wie in der Github-Readme-Datei zu Transmogrif kurz erwähnt:Das Gleiche gilt für die anderen erwähnten AutoML-Frameworks. Ebenso die TransmogrifAI Das Tool ist in der Lage, den besten Algorithmus für einen vom Benutzer ausgewählten Datensatz auszuwählen.
10. H2O Automatic Machine LearningH2O autoML
ist ein von H2O entwickeltes Open-Source-Framework-Tool, das sowohl R- als auch Python-Programmierung unterstützt. Es unterstützt auch die am häufigsten verwendeten statistischen und maschinellen Lernalgorithmen, einschließlich Gradientenverstärkungsmaschinen, verallgemeinerte lineare Modelle und Deep Learning. Die H2O-AutoML-Schnittstelle kommt neuen Benutzern des maschinellen Lernens entgegen, indem sie so wenige Parameter wie möglich erfordert. Die Hauptaufgabe des Benutzers bei der Verwendung des H2O-Tools besteht in der Bereitstellung des Datensatzes.Andere nützliche AutoML-Tools
1. HypertunityHypertunity
ist ein leichtgewichtiges Werkzeug, das entwickelt wurde, um einen bestimmten Hyperparameter eines Modells mithilfe eines leichtgewichtigen Pakets zu optimieren. Sie sind modular, einfach und erweiterbar, um eine nahtlose Planungsimplementierung zu ermöglichen. Hypertunity unterstützt die Bayes'sche Optimierung mit GPyOpt, Slurm-kompatiblen Schedulern und Echtzeitvisualisierung mit Tensorboard (über das HParams-Plugin). 2. DragonflyDragonfly
ist ein Open-Source-AutoML-Tool, das für die skalierbare Bayes'sche Optimierung entwickelt wurde. Bayesianische Optimierung wird verwendet, um sehr teure Black-Box-Funktionen über die normale Optimierung hinaus zu bewerten. Dragonfly ermöglicht es neuen Benutzern, skalierbare Bayes'sche Optimierungsfehler mit minimalem Wissen zu lösen.3. Ray Tune
ist unser zweites Hyperparameter-Optimierungstool und ein einheitliches Framework zur Skalierung von KI- und Python-Anwendungen. Es ermöglicht eine einfache KI-Workload-Skalierung durch verteilte Datenverarbeitung, verteiltes Training, skalierbares Hyperparameter-Tuning, skalierbares Reinforcement Learning und skalierbare programmierbare Dienste.Auto Graph Learning ist ein einzigartiges AutoML-Framework, das sich auf das maschinelle Lernen von Graph-Datensätzen konzentriert, ganz einfach und unkompliziert.
Sie verwenden Datensätze, um Datensätze für graphbasiertes maschinelles Lernen auf der Grundlage von Pytorch-Geometrien oder Datensätzen in der Deep Graph Library zu verwalten.
Mit den Fortschritten im Bereich des maschinellen und tiefen Lernens ist der Bedarf an Experten für maschinelles Lernen erheblich gestiegen, ohne dass darauf reagiert wurde.
Hier kommt die Automatisierung mit Tools und Techniken des maschinellen Lernens ins Spiel, die es neuen Benutzern ermöglicht, einfacher als je zuvor voll funktionsfähige und hochoptimierte Modelle zu erstellen.
Kurz gesagt: Wenn Sie nach dem perfekten Tool für automatisiertes maschinelles Lernen suchen, sollten Sie sich darauf konzentrieren, was Sie mit einem bestimmten Modell erreichen möchten und welchen Teil des maschinellen Lernprozesses Sie genau automatisieren möchten. Wir empfehlen Ihnen, mehrere der oben genannten AutoML-Tools selbst auszuprobieren und nur diejenigen zu verwenden, die Sie für effizient und benutzerfreundlich halten.
Das obige ist der detaillierte Inhalt vonZehn GitHub-Repositorys für AutoML. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!