Rumah >pembangunan bahagian belakang >Tutorial Python >Cara menggunakan modul scikit-learn untuk pembelajaran mesin dalam Python 3.x
Cara menggunakan modul scikit-learn untuk pembelajaran mesin dalam Python 3.x
Pengenalan:
Pembelajaran mesin ialah satu cabang kecerdasan buatan yang membolehkan komputer meningkatkan prestasinya dengan mempelajari dan melatih data. Antaranya, scikit-learn ialah perpustakaan pembelajaran mesin Python yang berkuasa yang menyediakan banyak algoritma dan alatan pembelajaran mesin yang biasa digunakan untuk membantu pembangun membina dan menggunakan model pembelajaran mesin dengan cepat. Artikel ini akan memperkenalkan cara menggunakan modul scikit-learn dalam Python 3.x untuk pembelajaran mesin, dengan contoh kod.
1. Pasang modul scikit-learn
Untuk menggunakan modul scikit-learn, anda perlu memasangnya terlebih dahulu. Anda boleh menggunakan alat pip untuk menyelesaikan pemasangan Hanya masukkan arahan berikut dalam baris arahan:
pip install scikit-learn
2. Import modul scikit-learn
Selepas pemasangan selesai, anda boleh mengimport scikit- belajar modul dalam skrip Python supaya Gunakan fungsinya. Kod yang diimport adalah seperti berikut:
import sklearn
3 Muatkan set data
Dalam pembelajaran mesin, biasanya perlu memuatkan set data dahulu, dan kemudian memproses dan menganalisisnya. scikit-learn menyediakan beberapa set data terbina dalam yang boleh digunakan untuk berlatih dan menguji algoritma. Kod berikut menunjukkan cara memuatkan Iris (bunga iris), set data terbina dalam scikit-learn:
daripada sklearn.datasets import load_iris
iris = load_iris()
4
Pada mesin Dalam pembelajaran, prapemprosesan data adalah langkah penting. Ia termasuk pembersihan data, pemilihan ciri, normalisasi data dan operasi lain untuk memastikan kualiti dan ketepatan data. Coretan kod berikut menunjukkan cara untuk menormalkan set data:
dari sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
Normalize a set data =
_ris 5. Pisahkan set data
Dalam pembelajaran mesin, biasanya perlu membahagikan set data kepada set latihan dan set ujian untuk digunakan semasa melatih model dan menilai prestasi model. Kod berikut menunjukkan cara membahagikan set data kepada set latihan dan set ujian:
dari sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split,(normalized_test_data iris .target, test_size=0.2)
6 Model latihan
scikit-learn menyediakan banyak algoritma pembelajaran mesin dan anda boleh memilih algoritma yang sesuai untuk latihan berdasarkan ciri dan matlamat data. Kod berikut menunjukkan contoh melatih model menggunakan algoritma regresi logistik:
dari sklearn.linear_model import LogisticRegression
model = LogisticRegression()
Selepas latihan selesai, prestasi model perlu dinilai. scikit-learn menyediakan pelbagai penunjuk penilaian yang boleh membantu kita menilai ketepatan dan kestabilan model. Kod berikut menunjukkan cara menggunakan ketepatan untuk menilai prestasi model:
daripada sklearn.metrics import accuracy_score
8 Penalaan Model
Berdasarkan keputusan penilaian, kita boleh menala model untuk meningkatkan prestasi model. scikit-learn menyediakan fungsi penalaan parameter, yang boleh mencari parameter model terbaik melalui carian grid dan kaedah lain. Kod berikut menunjukkan cara menggunakan carian grid untuk menala parameter model:dari sklearn.model_selection import GridSearchCV
Tentukan grid parameter
Buat objek GridSearchCV
Gunakan set latihan untuk carian grid
_Dapatkan parameter model terbaik
9 Gunakan model untuk ramalan
Selepas melengkapkan latihan dan penalaan model, anda boleh menggunakan model untuk membuat ramalan. Kod berikut menunjukkan cara menggunakan model terlatih untuk membuat ramalan pada data baharu:
Buat objek model baharu menggunakan parameter model terbaik
Gunakan keseluruhan set data untuk latihan model
Sediakan data baharu
Buat ramalan pada data baharu
Kesimpulan:
Artikel ini menerangkan cara menggunakan modul scikit-learn dalam Python 3.x untuk pembelajaran mesin. Dengan memasang modul, mengimport modul, memuatkan set data, prapemprosesan data, memisahkan set data, model latihan, menilai prestasi model, penalaan model dan menggunakan model untuk ramalan, pembaca boleh mempelajari cara menggunakan modul pembelajaran scikit untuk membina dan menggunakan model pembelajaran Mesin. Melalui amalan dan pembelajaran berterusan, kita boleh mendalami bidang pembelajaran mesin dan mencapai hasil yang lebih baik dalam aplikasi praktikal.Atas ialah kandungan terperinci Cara menggunakan modul scikit-learn untuk pembelajaran mesin dalam Python 3.x. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!