Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk melaksanakan klasifikasi linear menggunakan Python Scikit-learn?

Bagaimana untuk melaksanakan klasifikasi linear menggunakan Python Scikit-learn?

PHPz
PHPzke hadapan
2023-08-20 18:57:02781semak imbas

Klasifikasi linear ialah salah satu masalah pembelajaran mesin yang paling mudah. Untuk mencapai pengelasan linear, kami akan menggunakan pengelas SGD (Stochastic Gradient Descent) sklearn untuk meramalkan jenis bunga iris.

Langkah

Anda boleh melaksanakan klasifikasi linear menggunakan Python Scikit-learn dengan mengikuti langkah-langkah yang diberikan di bawah:

Langkah 1 − Mula-mula import pakej yang diperlukan scikit-learn, NumPy dan matplotlib

Langkah 2 − Muatkan set data dan bina set data latihan dan ujian.

Langkah 3 − Gunakan matplotlib untuk melukis contoh latihan. Walaupun langkah ini adalah pilihan, ia adalah amalan yang baik untuk menunjukkan contoh dengan lebih jelas.

Langkah 4 − Buat objek pengelas SGD, mulakan parameternya dan latih model menggunakan kaedah fit().

Langkah 5 − Nilaikan keputusan menggunakan pakej metrik perpustakaan Python Scikit-learn.

Contoh

diterjemahkan sebagai:

Contoh

Mari kita lihat contoh di bawah di mana kita akan meramalkan spesies bunga iris menggunakan dua ciri bunga iris iaitu lebar sepal dan panjang sepal.

# Import required libraries
import sklearn
import numpy as np
import matplotlib.pyplot as plt
# %matplotlib inline

# Loading Iris flower dataset
from sklearn import datasets
iris = datasets.load_iris()
X_data, y_data = iris.data, iris.target

# Print iris data shape
print ("Original Dataset Shape:",X_data.shape, y_data.shape)

# Dividing dataset into training and testing dataset and standarized the features
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Getting the Iris dataset with only the first two attributes
X, y = X_data[:,:2], y_data

# Split the dataset into a training and a testing set(20 percent)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.20, random_state=1)
print ("\nTesting Dataset Shape:", X_train.shape, y_train.shape)

# Standarize the features
scaler = StandardScaler().fit(X_train)
X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)

# Plot the dataset
# Set the figure size
plt.figure(figsize=(7.16, 3.50))
plt.subplots_adjust(bottom=0.05, top=0.9, left=0.05, right=0.95)
plt.title('Training instances', size ='18')
colors = ['orange', 'green', 'cyan']
for i in range(len(colors)):
   px = X_train[:, 0][y_train == i]
   py = X_train[:, 1][y_train == i]
   plt.scatter(px, py, c=colors[i])
   
plt.legend(iris.target_names)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.show()

# create the linear model SGDclassifier
from sklearn.linear_model import SGDClassifier
linear_clf = SGDClassifier()

# Train the classifier using fit() function
linear_clf.fit(X_train, y_train)

# Print the learned coeficients
print ("\nThe coefficients of the linear boundary are:", linear_clf.coef_)
print ("\nThe point of intersection of the line are:",linear_clf.intercept_)

# Evaluate the result
from sklearn import metrics
y_train_pred = linear_clf.predict(X_train)
print ("\nThe Accuracy of our classifier is:", metrics.accuracy_score(y_train, y_train_pred)*100)

Output

Ia akan menghasilkan output berikut

Original Dataset Shape: (150, 4) (150,)

Testing Dataset Shape: (120, 2) (120,)

The coefficients of the linear boundary are: [[-28.85486061 13.42772422]
[ 2.54806641 -5.04803702]
[ 7.03088805 -0.73391906]]

The point of intersection of the line are: [-19.61738307 -3.54055412 -0.35387805]

Ketepatan pengelas kami: 76.66666666666667

如何使用Python Scikit-learn实现线性分类?

Atas ialah kandungan terperinci Bagaimana untuk melaksanakan klasifikasi linear menggunakan Python Scikit-learn?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:tutorialspoint.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam