Heim >Backend-Entwicklung >Python-Tutorial >So verwenden Sie das scikit-learn-Modul für maschinelles Lernen in Python 2.x

So verwenden Sie das scikit-learn-Modul für maschinelles Lernen in Python 2.x

WBOY
WBOYOriginal
2023-07-30 14:09:22891Durchsuche

So verwenden Sie das Scikit-Learn-Modul für maschinelles Lernen in Python 2.x

Einführung:
Maschinelles Lernen ist eine Disziplin, die untersucht, wie Computer in die Lage versetzt werden können, aus Daten zu lernen und ihre eigene Leistung zu verbessern. scikit-learn ist eine Python-basierte Bibliothek für maschinelles Lernen, die viele Algorithmen und Tools für maschinelles Lernen bereitstellt, um maschinelles Lernen einfacher und effizienter zu machen.

In diesem Artikel wird die Verwendung des scikit-learn-Moduls für maschinelles Lernen in Python 2.x vorgestellt und Beispielcode bereitgestellt.

1. Installieren Sie das scikit-learn-Modul
Zuerst müssen wir sicherstellen, dass die Python 2.x-Version installiert ist. Anschließend können Sie das scikit-learn-Modul über den pip-Befehl installieren:

pip install -U scikit-learn

Nach Abschluss der Installation können Sie mit der Verwendung des scikit-learn-Moduls für maschinelles Lernen beginnen.

2. Datensätze laden
Beim maschinellen Lernen müssen wir normalerweise Datensätze laden und verarbeiten. scikit-learn bietet viele integrierte Datensätze, die direkt verwendet werden können. Im Folgenden wird der Iris-Datensatz als Beispiel zur Demonstration verwendet:

from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris.data, iris.target

Im obigen Code verwenden wir die Funktion load_iris(), um den Iris-Datensatz zu laden und dann die Eingabedaten im zu speichern Datensatz in der Variablen X, speichern Sie die entsprechende Beschriftung in der Variablen y. load_iris()函数加载了鸢尾花数据集,然后将数据集中的输入数据存储在变量X中,将对应的标签存储在变量y中。

三、划分数据集
在训练机器学习模型之前,我们需要将数据集划分为训练集和测试集。scikit-learn提供了train_test_split函数来实现数据集的划分。

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

上述代码中,我们将数据集划分为训练集和测试集,其中test_size=0.2表示测试集的比例为20%,random_state=42表示随机种子,以确保每次划分结果的一致性。

四、选择模型
在机器学习中,我们可以选择不同的模型来训练我们的数据集。在scikit-learn中,每个模型都有对应的类,我们可以通过创建模型类的实例来选择不同的模型。

以支持向量机(SVM)为例,使用SVC类来创建一个SVM模型的实例:

from sklearn.svm import SVC
model = SVC()

五、训练模型
一旦选择了模型,我们就可以使用训练数据集对模型进行训练。

model.fit(X_train, y_train)

上述代码中,我们使用fit方法对模型进行训练,将训练数据集X_train和对应的标签y_train作为输入。

六、模型评估
在训练完成后,我们需要使用测试数据集来评估模型的性能。

score = model.score(X_test, y_test)
print("模型准确率:", score)

上述代码中,我们使用score方法计算模型在测试数据集上的准确率,并输出评估结果。

七、模型预测
最后,我们可以使用训练好的模型进行预测。

y_pred = model.predict(X_test)
print("预测结果:", y_pred)

上述代码中,我们使用predict

3. Teilen Sie den Datensatz auf

Bevor wir das Modell für maschinelles Lernen trainieren, müssen wir den Datensatz in einen Trainingssatz und einen Testsatz aufteilen. scikit-learn bietet die Funktion train_test_split zum Teilen des Datensatzes.
rrreee

Im obigen Code teilen wir den Datensatz in einen Trainingssatz und einen Testsatz auf, wobei test_size=0.2 bedeutet, dass der Anteil des Testsatzes 20 % beträgt, und random_state =42 bedeutet „Zufällige Startwerte“, um jedes Mal konsistente Ergebnisse sicherzustellen.

4. Wählen Sie ein Modell aus🎜Beim maschinellen Lernen können wir verschiedene Modelle auswählen, um unseren Datensatz zu trainieren. In scikit-learn hat jedes Modell eine entsprechende Klasse, und wir können verschiedene Modelle auswählen, indem wir Instanzen der Modellklasse erstellen. 🎜🎜Nehmen Sie als Beispiel die Support Vector Machine (SVM) und verwenden Sie die Klasse SVC, um eine Instanz des SVM-Modells zu erstellen: 🎜rrreee🎜 5. Trainingsmodell 🎜Sobald das Modell ausgewählt ist, können wir es verwenden Der Trainingsdatensatz Trainiert das Modell. 🎜rrreee🎜Im obigen Code verwenden wir die Methode fit, um das Modell zu trainieren, indem wir den Trainingsdatensatz X_train und die entsprechende Bezeichnung y_train verwenden als Eingabe. 🎜🎜6. Modellbewertung🎜Nach Abschluss des Trainings müssen wir den Testdatensatz verwenden, um die Leistung des Modells zu bewerten. 🎜rrreee🎜Im obigen Code verwenden wir die Methode score, um die Genauigkeit des Modells anhand des Testdatensatzes zu berechnen und die Bewertungsergebnisse auszugeben. 🎜🎜7. Modellvorhersage🎜Schließlich können wir das trainierte Modell verwenden, um Vorhersagen zu treffen. 🎜rrreee🎜Im obigen Code verwenden wir die Methode predict, um den Testdatensatz vorherzusagen und die Vorhersageergebnisse auszugeben. 🎜🎜Zusammenfassung: 🎜Durch die Einleitung dieses Artikels haben wir gelernt, wie man das Scikit-Learn-Modul für maschinelles Lernen in Python 2.x verwendet. Wir haben die grundlegenden Schritte zum Laden eines Datensatzes, Partitionieren eines Datensatzes, Auswählen eines Modells, Trainieren eines Modells, Modellbewertung und Modellvorhersage gelernt und entsprechende Codebeispiele gegeben. 🎜🎜Ich hoffe, dieser Artikel wird Ihnen beim Erlernen des maschinellen Lernens und der Verwendung des Scikit-Learn-Moduls hilfreich sein. Ich wünsche Ihnen Fortschritte in Ihrem Studium und die Beherrschung der Fähigkeiten des maschinellen Lernens! 🎜

Das obige ist der detaillierte Inhalt vonSo verwenden Sie das scikit-learn-Modul für maschinelles Lernen in Python 2.x. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn