Data Mining ist der Prozess der Extraktion potenziell nützlicher Informationen und Wissen, die den Menschen im Voraus unbekannt sind, aus einer großen Menge unvollständiger, verrauschter, unscharfer und zufälliger Daten. Die Aufgabe des Data Mining besteht darin, Muster aus Datensätzen zu entdecken. Es können viele Muster entdeckt werden, die entsprechend ihrer Funktion in zwei Kategorien unterteilt werden können: Vorhersagemuster und beschreibende Muster.
Data-Mining-Software (empfohlenes Lernen: PHP-Video-Tutorial)
Orange
Orange ist eine komponentenbasierte Data-Mining- und Machine-Learning-Software-Suite. Ihre Funktionen sind ein benutzerfreundliches, leistungsstarkes, schnelles und vielseitiges visuelles Programmier-Frontend für die Analyse und Visualisierung von Browsing-Daten für Python zur Skriptentwicklung. Es enthält einen vollständigen Satz an Komponenten für die Datenvorverarbeitung und bietet Datenbuchhaltungs-, Übergangs-, Modellierungs-, Musterbewertungs- und Explorationsfunktionen. Es wurde in C++ und Python entwickelt und seine Grafikbibliothek wurde vom plattformübergreifenden Qt-Framework entwickelt.
RapidMiner
RapidMiner, früher YALE (Yet Another Learning Environment) genannt, ist eine Testumgebung für maschinelles Lernen sowie Data Mining und Analyse und wird auch für Forschungszwecke verwendet Data-Mining in der realen Welt. Die bereitgestellten Experimente bestehen aus einer Vielzahl von Operatoren, die in detaillierten XML-Dateien aufgezeichnet und über die grafische Benutzeroberfläche von RapidMiner angezeigt werden. RapidMiner bietet über 500 Operatoren für die wichtigsten maschinellen Lernprozesse und kombiniert Lernschemata mit Attributauswertungen für die Weka-Lernumgebung. Es handelt sich um ein eigenständiges Tool, das zur Datenanalyse verwendet werden kann, und um eine Data-Mining-Engine, die in Ihr Produkt integriert werden kann.
Weka
Weka (Waikato Environment for Knowledge Analysis), entwickelt von Java, ist eine bekannte Software für maschinelles Lernen, die mehrere klassische Data-Mining-Aufgaben unterstützt, insbesondere Datenvorverarbeitung, Clustering, Klassifizierung, Regression, Virtualisierung und Funktionsauswahl. Die Technologie basiert auf der Annahme, dass Daten als einzelne Datei oder Assoziation dargestellt werden, wobei jeder Datenpunkt mit einer Reihe von Attributen versehen ist. Weka nutzt die Datenbankverknüpfungsfunktionen von Java, um auf SQL-Datenbanken zuzugreifen und Abfrageergebnisse aus einer Datenbank zu verarbeiten. Seine Hauptbenutzeroberfläche ist der Explorer, der auch die gleiche Funktionalität wie die Befehlszeile oder eine komponentenbasierte Wissensflussschnittstelle unterstützt.
JHepWork
jHepWork wurde für Wissenschaftler, Ingenieure und Studenten entwickelt und ist ein kostenloses Open-Source-Datenanalyse-Framework, das hauptsächlich Open-Source-Bibliotheken verwendet, um eine Datenanalyseumgebung zu erstellen bietet eine umfangreiche Benutzeroberfläche, um mit dieser kostenpflichtigen Software zu konkurrieren. Es ist hauptsächlich für zweidimensionale und dreidimensionale Grafiken für das wissenschaftliche Rechnen konzipiert und umfasst in Java implementierte mathematisch-wissenschaftliche Bibliotheken, Zufallszahlen und andere Data-Mining-Algorithmen. jHepWork basiert auf der höheren Programmiersprache Jython. Selbstverständlich können die Mathematik- und Grafikbibliotheken von jHepWork auch mit Java-Code aufgerufen werden.
KNIME
KNIME (Konstanz Information Miner) ist eine benutzerfreundliche, intelligente und leistungsstarke Open-Source-Plattform für Datenintegration, Datenverarbeitung, Datenanalyse und Datenexploration. Es gibt Benutzern die Möglichkeit, Datenflüsse oder Datenkanäle visuell zu erstellen, optional einige oder alle Analyseschritte auszuführen und später die Ergebnisse, Modelle und interaktiven Ansichten zu erkunden. KNIME ist in Java geschrieben, basiert auf Eclipse und bietet durch Plug-Ins mehr Funktionalität. Über Plug-in-Dateien können Benutzer Verarbeitungsmodule zu Dateien, Bildern und Zeitreihen hinzufügen und in verschiedene andere Open-Source-Projekte integrieren, z. B. R-Sprache, Weka, Chemistry Development Kit und LibSVM.
Weitere technische Artikel zum Thema PHP finden Sie in der Spalte PHP-Grafik-Tutorial, um mehr darüber zu erfahren!
Das obige ist der detaillierte Inhalt vonWelche Software eignet sich für das Data Mining?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!