Rumah >pembangunan bahagian belakang >Tutorial Python >Cara menggunakan modul scikit-learn untuk pembelajaran mesin dalam Python 3.x

Cara menggunakan modul scikit-learn untuk pembelajaran mesin dalam Python 3.x

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBasal
2023-07-30 09:37:492275semak imbas

Cara menggunakan modul scikit-learn untuk pembelajaran mesin dalam Python 3.x

Pengenalan:
Pembelajaran mesin ialah satu cabang kecerdasan buatan yang membolehkan komputer meningkatkan prestasinya dengan mempelajari dan melatih data. Antaranya, scikit-learn ialah perpustakaan pembelajaran mesin Python yang berkuasa yang menyediakan banyak algoritma dan alatan pembelajaran mesin yang biasa digunakan untuk membantu pembangun membina dan menggunakan model pembelajaran mesin dengan cepat. Artikel ini akan memperkenalkan cara menggunakan modul scikit-learn dalam Python 3.x untuk pembelajaran mesin, dengan contoh kod.

1. Pasang modul scikit-learn
Untuk menggunakan modul scikit-learn, anda perlu memasangnya terlebih dahulu. Anda boleh menggunakan alat pip untuk menyelesaikan pemasangan Hanya masukkan arahan berikut dalam baris arahan:
pip install scikit-learn

2. Import modul scikit-learn
Selepas pemasangan selesai, anda boleh mengimport scikit- belajar modul dalam skrip Python supaya Gunakan fungsinya. Kod yang diimport adalah seperti berikut:
import sklearn

3 Muatkan set data
Dalam pembelajaran mesin, biasanya perlu memuatkan set data dahulu, dan kemudian memproses dan menganalisisnya. scikit-learn menyediakan beberapa set data terbina dalam yang boleh digunakan untuk berlatih dan menguji algoritma. Kod berikut menunjukkan cara memuatkan Iris (bunga iris), set data terbina dalam scikit-learn:
daripada sklearn.datasets import load_iris

Muat set data bunga iris

iris = load_iris()

4
Pada mesin Dalam pembelajaran, prapemprosesan data adalah langkah penting. Ia termasuk pembersihan data, pemilihan ciri, normalisasi data dan operasi lain untuk memastikan kualiti dan ketepatan data. Coretan kod berikut menunjukkan cara untuk menormalkan set data:
dari sklearn.preprocessing import MinMaxScaler

Cipta objek MinMaxScaler

scaler = MinMaxScaler()

Normalize a dataset

Normalize a set data =

_ris

5. Pisahkan set data
Dalam pembelajaran mesin, biasanya perlu membahagikan set data kepada set latihan dan set ujian untuk digunakan semasa melatih model dan menilai prestasi model. Kod berikut menunjukkan cara membahagikan set data kepada set latihan dan set ujian:
dari sklearn.model_selection import train_test_split

Pisah set data kepada set latihan dan set ujian

X_train, X_test, y_train, y_test = train_test_split,(normalized_test_data iris .target, test_size=0.2)

6 Model latihan
scikit-learn menyediakan banyak algoritma pembelajaran mesin dan anda boleh memilih algoritma yang sesuai untuk latihan berdasarkan ciri dan matlamat data. Kod berikut menunjukkan contoh melatih model menggunakan algoritma regresi logistik:
dari sklearn.linear_model import LogisticRegression

Buat objek model regresi logistik

model = LogisticRegression()

Gunakan set latihan untuk melatih model

model.fit(X_train , y_train)

7 Nilai prestasi model

Selepas latihan selesai, prestasi model perlu dinilai. scikit-learn menyediakan pelbagai penunjuk penilaian yang boleh membantu kita menilai ketepatan dan kestabilan model. Kod berikut menunjukkan cara menggunakan ketepatan untuk menilai prestasi model:
daripada sklearn.metrics import accuracy_score

Gunakan set ujian untuk membuat ramalan

y_pred = model.predict(X_test)

Kira ketepatan

accuracy_score(y_test , y_pred)

8 Penalaan Model

Berdasarkan keputusan penilaian, kita boleh menala model untuk meningkatkan prestasi model. scikit-learn menyediakan fungsi penalaan parameter, yang boleh mencari parameter model terbaik melalui carian grid dan kaedah lain. Kod berikut menunjukkan cara menggunakan carian grid untuk menala parameter model:

dari sklearn.model_selection import GridSearchCV

Tentukan grid parameter

param_grid = {'C': [0.01, 0.1, 1, 10], 'penalti' : 'l1', 'l2']}

Buat objek GridSearchCV

grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=5)

Gunakan set latihan untuk carian grid

_

(grid_search . )

Dapatkan parameter model terbaik

best_params = grid_search.best_params_

9 Gunakan model untuk ramalan

Selepas melengkapkan latihan dan penalaan model, anda boleh menggunakan model untuk membuat ramalan. Kod berikut menunjukkan cara menggunakan model terlatih untuk membuat ramalan pada data baharu:


Buat objek model baharu menggunakan parameter model terbaik

best_model = LogisticRegression(**best_params)

Gunakan keseluruhan set data untuk latihan model

best_model .fit(normalized_data, iris.target)

Sediakan data baharu

new_data = [[5.1, 3.5, 1.4, 0.2], [6.7, 3.1, 4.4, 1.4], [6.5, 3.0], 2.5, 3.0]

Buat ramalan pada data baharu

predictions = best_model.predict(new_data)

Kesimpulan:

Artikel ini menerangkan cara menggunakan modul scikit-learn dalam Python 3.x untuk pembelajaran mesin. Dengan memasang modul, mengimport modul, memuatkan set data, prapemprosesan data, memisahkan set data, model latihan, menilai prestasi model, penalaan model dan menggunakan model untuk ramalan, pembaca boleh mempelajari cara menggunakan modul pembelajaran scikit untuk membina dan menggunakan model pembelajaran Mesin. Melalui amalan dan pembelajaran berterusan, kita boleh mendalami bidang pembelajaran mesin dan mencapai hasil yang lebih baik dalam aplikasi praktikal.

Atas ialah kandungan terperinci Cara menggunakan modul scikit-learn untuk pembelajaran mesin dalam Python 3.x. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn