Heim >Backend-Entwicklung >Python-Tutorial >Erste Schritte mit Python für maschinelles Lernen
Pythons Popularität beim maschinellen Lernen (ML) beruht auf seiner Benutzerfreundlichkeit, Flexibilität und umfangreichen Bibliotheksunterstützung. Dieser Leitfaden bietet eine grundlegende Einführung in die Verwendung von Python für ML, deckt wichtige Bibliotheken ab und demonstriert einen einfachen Modellaufbau.
Pythons Dominanz im ML-Bereich ist auf mehrere entscheidende Vorteile zurückzuführen:
Python bietet umfassende Tools für jede Phase des ML-Prozesses, von der Datenanalyse bis zur Modellbereitstellung.
Bevor Sie Ihre ML-Reise beginnen, machen Sie sich mit diesen wichtigen Python-Bibliotheken vertraut:
NumPy: Der Eckpfeiler des numerischen Rechnens in Python. Bietet Unterstützung für Arrays, Matrizen und mathematische Funktionen.
Pandas: Eine leistungsstarke Bibliothek für die Datenbearbeitung und -analyse. Seine DataFrame-Struktur vereinfacht die Arbeit mit strukturierten Daten.
Scikit-learn: Die am häufigsten verwendete ML-Bibliothek in Python. Bietet effiziente Tools für Data Mining und Analyse, einschließlich Algorithmen für Klassifizierung, Regression und Clustering.
Installieren Sie die erforderlichen Bibliotheken mit pip:
<code class="language-bash">pip install numpy pandas scikit-learn</code>
Nach der Installation können Sie mit dem Codieren beginnen.
Lassen Sie uns mithilfe des Iris-Datensatzes ein grundlegendes ML-Modell erstellen, das Irisarten anhand der Blütenblattmessungen klassifiziert.
Schritt 1: Bibliotheken importieren
Importieren Sie die erforderlichen Bibliotheken:
<code class="language-python">import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score</code>
Schritt 2: Laden Sie den Datensatz
Laden Sie den Iris-Datensatz mit Scikit-learn:
<code class="language-python"># Load the Iris dataset iris = load_iris() # Convert to a Pandas DataFrame data = pd.DataFrame(iris.data, columns=iris.feature_names) data['species'] = iris.target</code>
Schritt 3: Datenexploration
Analysieren Sie die Daten:
<code class="language-python"># Display initial rows print(data.head()) # Check for missing values print(data.isnull().sum()) # Summary statistics print(data.describe())</code>
Schritt 4: Datenvorbereitung
Trennen Sie Funktionen (X) und Beschriftungen (y) und teilen Sie die Daten in Trainings- und Testsätze auf:
<code class="language-python"># Features (X) and labels (y) X = data.drop('species', axis=1) y = data['species'] # Train-test split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)</code>
Schritt 5: Modellschulung
Trainieren Sie einen Random Forest-Klassifikator:
<code class="language-bash">pip install numpy pandas scikit-learn</code>
Schritt 6: Vorhersage und Bewertung
Machen Sie Vorhersagen und bewerten Sie die Modellgenauigkeit:
<code class="language-python">import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score</code>
Herzlichen Glückwunsch! Sie haben Ihr erstes ML-Modell erstellt. Um Ihr Lernen voranzutreiben:
Das obige ist der detaillierte Inhalt vonErste Schritte mit Python für maschinelles Lernen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!